
Mamba 模型精讲
文章平均质量分 94
这个男人是小帅
求其上,得其中;求其中,得其下,求其下,必败。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【Mamba】详解(5) 【Mamba: 硬件感知算法】全网最简单版本
这个Mamba的讲解到此结束了,其实比较难理解的还是SSM前期的准备,在后续的部分都是一些参数规模以及更高层面的东西,这确实需要大量工作的累积。还是与很多巧思在里面的,这同样也是作者的功力嘛。如果你对这样的讲解方式觉得有趣,喜欢。欢迎催更。如果帮助到你十分荣幸。有任何问题或建议,欢迎随时通过私信评论与我交流。期待你们的反馈。原创 2024-12-04 15:33:05 · 1748 阅读 · 1 评论 -
【Mamba】详解(4) 【Mamba: 选择性 SSM】全网最简单版本
【Mamba】详解(4) 【Mamba: 选择性 SSM】,在之前的章节中我们讲解了HiPPO,以及S4,以及这一章节的Mamba的第一个创新,下一节将迎来最中的完结部分。如果你对这样的讲解方式觉得有趣,喜欢。欢迎催更。如果帮助到你十分荣幸。有任何问题或建议,欢迎随时通过私信评论与我交流。期待你们的反馈。原创 2024-12-04 15:32:20 · 3395 阅读 · 0 评论 -
【Mamba】详解(3) 【S4理解】全网最简单版本
这仅仅是Mamba详解(3) 【S4理解】,我们讲解了HiPPO,以及S4,确实这部分比较干。不过可以看到作者对其模型的理解和思考,确实让我受益颇深。主要是学术灌水的时代看到真东西很不错了。我相信这三节的学习你一定是对这个SSM或者S4有了一个清晰的认识。如果你对这样的讲解方式觉得有趣,喜欢。欢迎催更。如果帮助到你十分荣幸。有任何问题或建议,欢迎随时通过私信评论与我交流。期待你们的反馈。原创 2024-12-02 12:03:17 · 1672 阅读 · 0 评论 -
【Mamba】详解(2) 【离散SSM和SSM并行化】全网最简单版本
这仅仅是Mamba详解(2) 【离散SSM和SSM并行化的理解】,如果你对这样的讲解方式觉得有趣,喜欢。欢迎催更。如果帮助到你十分荣幸。有任何问题或建议,欢迎随时通过私信评论与我交流。期待你们的反馈。原创 2024-11-25 13:42:35 · 1782 阅读 · 0 评论 -
【Mamba】详解(1) 【SSM理解】全网最简单版本
ok我想大家都明白了这个SSM的公式咱们再总结下,和正常的其他博文接轨下。在状态空间模型中,有两个基本的方程:状态方程和观测方程。这两个方程共同构成了模型的完整结构状态方程状态方程描述的是系统状态变量的演化过程,ht′AhtBxtht′AhtBxt就是一个典型的状态方程。这个方程解释了系统状态如何通过内部动力学(由AAA表示)以及外部输入(由BBB和xtx_txt表示)演进。原创 2024-11-25 13:41:05 · 2511 阅读 · 3 评论