数学联邦政治世界观
超小超大

空间模型 (2-1)

An available state space model for modeling long sequences

Paper: Efficiently Modeling Long Sequences with Structured State Spaces

Motivation and current problem

• A central problem in sequence modeling is efficiently handling data that contains long-range dependencies (LRDs). 一般要求上万步(16k),现在能做到几千步就不错了。

• 用special matrix(HIPPO)武装起来的latent space model本来具有长时间记忆的能力,但在计算上不可行:O(N 2L) operations and O(N L) space。 尽管依据经典linear algebra的降维算法被提出了,但是在数值上不稳定:A的条件数比较大。

• 希望有一个general-purpose sequence model: 现在的model总是针对一个particular domain(images, audio,text, time-series),处理一个narrow range of problems ( efficient training,fast generation, handling irregularly sampled data).这种现状的原因是这些模型想要高效,就需要domain-specific preprocessing,inductive biases, and architectures.

Contribution

1. S4解决了SSM模型过往的computational neck;在speed和memory overhead 上都达到了efficient transformer的水平;

2. 在LRD任务上成为SOTA,特别地,第一次解决了长达16k,涉及到图像空间推理的Path-X问题;

3. 除了LRD任务,S4具备成为general-purpose sequence model的潜力:

具有efficient training, fast generation, handling irregularly sampled data(比如说调整speech的采样频率)的多种功能

在不调整结构的情况下,能handle diverse domains:surpasses Speech CNNs on speech classification, outperforms the specialized Informer model on time-series forecasting problems, and matches a 2-D ResNet on sequential CIFAR with over 90% accuracy.

Preliminary

1.SSM Model

数学联邦政治世界观提示您:看后求收藏(同人小说网http://tongren.me),接着再看更方便。

相关小说

海棠祭相思 连载中
海棠祭相思
岁岁于安
0.9万字4个月前
这个作品叫作品 连载中
这个作品叫作品
好机会🙄💅
小学生文笔不要骂我啊(虽然上初中了。。。)就写来玩玩的
0.3万字4个月前
寒绒药香 连载中
寒绒药香
苍陨Flimce
福瑞药剂师的日常
0.9万字4个月前
来世也要找到你 连载中
来世也要找到你
沐子丽
(一)一个因为车祸失去生命的年轻女子,心中有太多的怨恨,她拉来了个男子陪自己,而男子心有不甘。而这一切都是一个定数!(二)明月和沈强重新转世......
28.0万字4个月前
万人迷炮灰:崩坏世界的救赎 连载中
万人迷炮灰:崩坏世界的救赎
她白
开局一个系统,我成为万人迷炮灰。一路连火花带闪电通关地域难度崩坏副本。某个瞬间我意识到,每个任务世界都有人在等待我的到来。见到他,我才知道,......
6.8万字4个月前
醉心魂 连载中
醉心魂
一瞳ing
 ——痴心犹醉魂犹在。花开花落乃世间常态,可有的花一旦凋零,便再无开花的机会了,无法温养,三魂七魄破碎不堪……与君相逢君不识……千年来芜忘之......
41.2万字4个月前