数学联邦政治世界观
超小超大

空间模型 (2-1)

An available state space model for modeling long sequences

Paper: Efficiently Modeling Long Sequences with Structured State Spaces

Motivation and current problem

• A central problem in sequence modeling is efficiently handling data that contains long-range dependencies (LRDs). 一般要求上万步(16k),现在能做到几千步就不错了。

• 用special matrix(HIPPO)武装起来的latent space model本来具有长时间记忆的能力,但在计算上不可行:O(N 2L) operations and O(N L) space。 尽管依据经典linear algebra的降维算法被提出了,但是在数值上不稳定:A的条件数比较大。

• 希望有一个general-purpose sequence model: 现在的model总是针对一个particular domain(images, audio,text, time-series),处理一个narrow range of problems ( efficient training,fast generation, handling irregularly sampled data).这种现状的原因是这些模型想要高效,就需要domain-specific preprocessing,inductive biases, and architectures.

Contribution

1. S4解决了SSM模型过往的computational neck;在speed和memory overhead 上都达到了efficient transformer的水平;

2. 在LRD任务上成为SOTA,特别地,第一次解决了长达16k,涉及到图像空间推理的Path-X问题;

3. 除了LRD任务,S4具备成为general-purpose sequence model的潜力:

具有efficient training, fast generation, handling irregularly sampled data(比如说调整speech的采样频率)的多种功能

在不调整结构的情况下,能handle diverse domains:surpasses Speech CNNs on speech classification, outperforms the specialized Informer model on time-series forecasting problems, and matches a 2-D ResNet on sequential CIFAR with over 90% accuracy.

Preliminary

1.SSM Model

数学联邦政治世界观提示您:看后求收藏(同人小说网http://tongren.me),接着再看更方便。

相关小说

Aphmau整活 连载中
Aphmau整活
baisS_760
0.2万字1个月前
白铃兰香 连载中
白铃兰香
悠然dusk
为维护本站良好的小说创作环境,您作品《[ABO文,双女主]“姐姐,我爱你。”“我也是。”“你又把我忘了…”“棂悠,再给我一次机会好不好…”“......
13.8万字1个月前
重生者之复仇双子 连载中
重生者之复仇双子
郁雨笙
一团梦,是梦里妇人记不清的梦。那对双子星辰,日与月辉耀相间,印这世——那世片刻的光辉,是那个瞬间世间又无光:白色的天空,没有人类气息的空城,......
11.5万字4周前
我自己瞎写的文 连载中
我自己瞎写的文
一个没有名字的银儿
就是很多自己瞎写的片段啦。也叫啥都写的杂文。理性观看,有雷点,谢谢
14.0万字4周前
快穿直播之落总在线宠夫 连载中
快穿直播之落总在线宠夫
樱空落舞
[签约啦签约啦~禁搬运,禁抄袭~霸道冷酷无情拽上天的落总ⅹ娇软柔弱‘可欺’易推到小娇夫没有失忆梗,替身梗因为本文是快穿文,所以各个外面都有不......
8.5万字4周前
沧溟之雪之红颜天下 连载中
沧溟之雪之红颜天下
希海玉
【本文原创,禁止二转,禁止抄袭,违者必究】银落雪,华夏特工之王,因一次任务而意外来到东沧溟大陆,从此开启了她传奇的一生
8.0万字4周前