数学联邦政治世界观
超小超大

空间模型 (2-1)

An available state space model for modeling long sequences

Paper: Efficiently Modeling Long Sequences with Structured State Spaces

Motivation and current problem

• A central problem in sequence modeling is efficiently handling data that contains long-range dependencies (LRDs). 一般要求上万步(16k),现在能做到几千步就不错了。

• 用special matrix(HIPPO)武装起来的latent space model本来具有长时间记忆的能力,但在计算上不可行:O(N 2L) operations and O(N L) space。 尽管依据经典linear algebra的降维算法被提出了,但是在数值上不稳定:A的条件数比较大。

• 希望有一个general-purpose sequence model: 现在的model总是针对一个particular domain(images, audio,text, time-series),处理一个narrow range of problems ( efficient training,fast generation, handling irregularly sampled data).这种现状的原因是这些模型想要高效,就需要domain-specific preprocessing,inductive biases, and architectures.

Contribution

1. S4解决了SSM模型过往的computational neck;在speed和memory overhead 上都达到了efficient transformer的水平;

2. 在LRD任务上成为SOTA,特别地,第一次解决了长达16k,涉及到图像空间推理的Path-X问题;

3. 除了LRD任务,S4具备成为general-purpose sequence model的潜力:

具有efficient training, fast generation, handling irregularly sampled data(比如说调整speech的采样频率)的多种功能

在不调整结构的情况下,能handle diverse domains:surpasses Speech CNNs on speech classification, outperforms the specialized Informer model on time-series forecasting problems, and matches a 2-D ResNet on sequential CIFAR with over 90% accuracy.

Preliminary

1.SSM Model

数学联邦政治世界观提示您:看后求收藏(同人小说网http://tongren.me),接着再看更方便。

相关小说

名柯聊天室内1 连载中
名柯聊天室内1
199***325_5023543990
0.3万字4周前
忘川夜话:幻世尘缘 连载中
忘川夜话:幻世尘缘
夜楹曦梦
【已完结】【黑历史,雷者慎入】对与错的界限从未清晰,善与恶的区别从未分明。命运的洪流里,没有人能够独善其身,规则在世界之上俯视着岁月,逆命者......
55.8万字4周前
万人迷神明他并不清冷 连载中
万人迷神明他并不清冷
绪生
原创原创原创原本是想写清冷美人的,就是对别人清冷,熟悉的人温和,说不上来,随便看看吧是一时兴起写的,不是将主角从头到尾的故事写出来的,不喜勿......
12.6万字4周前
屿晏 连载中
屿晏
等黯.
【双男主,神魔世界,双洁,有副cp,男主感情迟钝,主角团的任务是拯救世界】冥冥之中有什么东西在指引顾晏晏(顾晏)变强,找到他,保护好这个世界......
14.9万字4周前
盛世婚宠:摄政王独宠帝妃 连载中
盛世婚宠:摄政王独宠帝妃
milchlly
  墨连城和曲檀儿从玄灵大陆消灭魔帝后,被时空之门带回现代世界、国际都市中,而上古之神帮助诸位神灵汇聚仙体和记忆,十世轮回、十世情缘、十世修......
24.8万字4周前
雪影重蝶 连载中
雪影重蝶
灵轩泪__账号暂无
创世之神与灭世之神的绝世爱恋——“我会一直保护好妹妹的!”——“葛格…”“……?”“哈哈哈,是哥哥啦!”
3.8万字4周前