数学联邦政治世界观
超小超大

柏拉图表示假说 (13-5)

在GSM8K上的性能(5张照片)

lla3-70b

0.8 -

0.6 -

mixial-8x7b

gemma-7b

ima3-8b

llama-65b

0.4

mistral-7b

LAN ha-33b

0.2 -

Gemma·2b

ma-13b

ama-7b

penllama-13bl lmo.7b

Bloom-1.7b Bloom-3b

penllama-7b

olmo-1b

Bloom-560m

Bloom-7.1b

0.0-

Bloom-1.1b

openllama-3b

0.16

0.18

0.22

0.24

0.20

0.26

0.14

对准VISION(DINOv2)

llama3-70b

0.701

混合的

赫拉斯瓦格

骆马·33

0.65

llama-65b

西北风-7b

na-1db iamae.8b

0.60 -

宝石-

ama-7b

lmo-7b

penllama-13b

0.55 -

上的性能

gemma-2b

penllama-7b

0.50

openllama-3b

olmo-1b

Bloom-7.1b

0.45 -

Bloom-3b

0.40 -

Bloom-1.7b

0.35 -

Bloom-1.1b

Bloom-560m

0.30 -

0.14

0.16

0.18

0.20

0.22

0.24

0.26

对准VISION(DINOv2)

图4.对齐预测下游性能

对齐预测下游性能:我们可视化了LLM对DINOv2的对齐得分与Hellaswag~(常识)和GSM8K~(数学)下游任务表现之间的相关性。LLMs的半径与模型大小成比例,并按语言建模分数的排名顺序 1 – bits–per–byte 进行颜色编码。我们观察到与视觉模型更紧密对齐的模型在下游语言任务中表现更好。对于Hellaswag,对齐得分和表现之间存在线性关系,而GSM8K则展示了“涌现”趋势。

表示正在跨模态趋同

不同数据模态训练的模型是否也在趋同?几项研究表明答案是肯定的。

Merullo et al. (2022) 将模型缝合扩展到跨模态设置,发现单个线性投影就足以将视觉模型与LLM缝合,并在视觉问答和图像描述任务上取得良好表现。Koh et al. (2023) 显示线性缝合也可以反向工作,将文本输入对齐到视觉输出。实际上,许多最新的语言-视觉模型都是通过缝合预训练的语言和视觉模型来实现的。例如,LLaVA通过使用两层MLP将视觉特征投影到语言模型中,展示了最先进的结果。

数学联邦政治世界观提示您:看后求收藏(同人小说网http://tongren.me),接着再看更方便。

相关小说

末世之上官燕 连载中
末世之上官燕
starmoon玖
♥已完结♥孤儿院长大的上官燕,性格坚毅,为人冷漠,在末世的她又会如何生活?新手写书!多多包涵!感谢支持!!
18.8万字4周前
异国大营救(团宠懒羊羊) 连载中
异国大营救(团宠懒羊羊)
翎伊柠
这里懒洋洋是团宠,也被猫化了,好像除了灰太狼全都被猫化了,快来看看灰太狼怎么拯救他们
0.5万字4周前
救赎:邻家的天使同学 连载中
救赎:邻家的天使同学
狐狸小生
刚20岁的我,终于可以实现童年的梦想,但现实很残酷,不断使我迷茫,经历梦幻般的救赎,使我拥有了前进的勇气。
3.2万字4周前
千金重生之霸道总裁 连载中
千金重生之霸道总裁
墨颜卿
“你为什么对我这么好啊?”“因为我爱你啊!”——冷心被害家破人亡因此与林家少爷结下误会,如今意外重生,又将会是怎样一个故事呢?
6.1万字4周前
那一地的碎玻璃 连载中
那一地的碎玻璃
陈远陌
【已完结2021.9.5签约】许江遥:你总是喜欢把我对你的所有爱与信任耗光……蒋泽渊:从不曾停止对你的爱,却被命运左右为难……蒋泽渊:我带着......
8.2万字4周前
穿越的爱没有结尾 连载中
穿越的爱没有结尾
是夜幕降临呀
【已签约】【本书连着三季,不喜勿喷】我不小心到了吸血鬼的世界,在这里我遇到了他。亏我命大,这里有我的情敌。浩然和长公主的爱情寥寥结束。魏江的......
5.4万字4周前