Linear-Time

《Mamba: Linear-Time Sequence Modeling with Selective State Spaces》阅读笔记

论文标题 《Mamba: Linear-Time Sequence Modeling with Selective State Spaces》 作者 Albert Gu 和 Tri Dao 初读 摘要 Transformer 架构及其核心注意力模块 地位:目前深度学习领域普遍的基础模型。 为了解决 ......
共1篇  :1/1页 首页上一页1下一页尾页