Mamba: Linear-Time Sequence Modeling with Selective State Spaces (Paper Explained)

Mamba: Linear-Time Sequence Modeling with Selective State Spaces (Paper Explained)

Share:

Similar Tracks

MAMBA from Scratch: Neural Nets Better and Faster than Transformers Algorithmic Simplicity

MAMBA and State Space Models explained | SSM explained AI Coffee Break with Letitia

Were RNNs All We Needed? (Paper Explained) Yannic Kilcher

xLSTM: Extended Long Short-Term Memory Yannic Kilcher

3.4 Bayesian Model Comparison - Pattern Recognition and Machine Learning Sina Tootoonian

Efficiently Modeling Long Sequences with Structured State Spaces - Albert Gu | Stanford MLSys #46 Stanford MLSys Seminars

Transformers (how LLMs work) explained visually | DL5 3Blue1Brown

Scaling LLM Test-Time Compute Optimally can be More Effective than Scaling Model Parameters (Paper) Yannic Kilcher

Mamba, Mamba-2 and Post-Transformer Architectures for Generative AI with Albert Gu - 693 The TWIML AI Podcast with Sam Charrington

TokenFormer: Rethinking Transformer Scaling with Tokenized Model Parameters (Paper Explained) Yannic Kilcher

Mamba and S4 Explained: Architecture, Parallel Scan, Kernel Fusion, Recurrent, Convolution, Math Umar Jamil

Kolmogorov-Arnold Networks (KANs): Redefining Neural Nets? | MLBBQ | Theodore LaGrow Understanding Machine Learning

Andrew Ng Explores The Rise Of AI Agents And Agentic Reasoning | BUILD 2024 Keynote Snowflake Inc.

RWKV: Reinventing RNNs for the Transformer Era (Paper Explained) Yannic Kilcher

【博士Vlog】2024最新模型Mamba详解，Transformer已死，你想知道的都在这里了！ Ph.D. Vlog

Visualizing transformers and attention | Talk for TNG Big Tech Day '24 Grant Sanderson

Attention in transformers, visually explained | DL6 3Blue1Brown

Scalable MatMul-free Language Modeling (Paper Explained) Yannic Kilcher

MedAI #41: Efficiently Modeling Long Sequences with Structured State Spaces | Albert Gu Stanford MedAI

Mamba - a replacement for Transformers? Samuel Albanie