数学联邦政治世界观
超小超大

柏拉图表示假说 (13-1)

柏拉图表示假说 The Platonic Representation Hypothesis

柏拉图表示假设

Minyoung Huh, Brian Cheung, Tongzhou Wang, Phillip Isola

麻省理工学院

联系人: Minyoung Huh (minhuh@)

关键词: 机器学习, 表示, 人工智能, 多模态

译者:GPT-4o

摘要

我们认为AI模型,特别是深度网络中的表示正在趋同。首先,我们调查了文献中的许多趋同例子:随着时间的推移和跨多个领域,不同神经网络表示数据的方式越来越趋于一致。接着,我们展示了跨数据模态的趋同:随着视觉模型和语言模型的规模增大,它们测量数据点之间距离的方式越来越相似。我们假设这种趋同正在朝着一个共享的统计模型发展,类似于柏拉图的理想现实概念。我们将这种表示称为柏拉图表示,并讨论几种可能的选择压力。最后,我们讨论这些趋势的影响、局限性以及我们分析的反例。

项目页面: phillipi./prh

代码: /minyoungg/platonic-rep

引言

AI系统正在迅速发展成高度多功能的实体。例如,过去我们针对不同的语言处理任务(如情感分析、解析、对话)有专门的解决方案,而现代的大型语言模型(LLMs)使用一组权重就能胜任所有这些任务。跨数据模态的统一系统也在构建:最近的模型如GPT4-V、Gemini和LLaVA,使用结合架构处理图像和文本。越来越多的系统建立在通用预训练骨干模型基础上,这些模型支持广泛的任务,包括机器人、生物信息学和医疗。简言之,AI系统在架构和能力上变得越来越同质化。

柏拉图表示假设:神经网络在不同目标和不同数据模态下训练,正在趋同到一个共享的统计模型在其表示空间中的表现。

Z

X ↙ ↘

→ Y

A red sphere next to a blue cone.

↓ ↓

▯ ▯

柏拉图表示假设:图像(X) 和文本 (Y) 是共同底层现实 (Z) 的投影。我们推测表示学习算法将趋同于 Z 的共享表示,并且模型规模、数据和任务多样性的扩大推动了这种趋同。

本文探讨了这一趋势的一个方面:表示趋同。我们认为在不同神经网络模型中,数据点表示的相似性在不断增加。这种相似性跨越了不同的模型架构、训练目标,甚至是数据模态。

是什么导致了这种趋同?它会继续吗?最终,它会达到什么程度?

数学联邦政治世界观提示您:看后求收藏(同人小说网http://tongren.me),接着再看更方便。

相关小说

TOP登陆少年:蝶恋 连载中
TOP登陆少年:蝶恋
予荷H
*幻世界*BE预警*TOP全员*想法大爆发一些穿插了各种元素的超绝小说(BE)喜欢的来#风之神—朱志鑫#顶流男歌手—张泽禹#雪之神—张极#克......
0.3万字1年前
懒皓密语:来自时空乱码的考验 连载中
懒皓密语:来自时空乱码的考验
只想要有你的生活
五年前,他对她信誓旦旦地说:
3.7万字1年前
神秘研究所 连载中
神秘研究所
噩医
故事是作者的姐姐想出来的,但作者觉得这个故事只要是人就会喜欢,故事情节也许会有漏洞,但不要在意这些细节了嘛~
1.0万字1年前
天道不公,我便逆天! 连载中
天道不公,我便逆天!
孤蜀依
李红尘逆天而行,结果被三位三清天尊打败,李红尘意外重生但变成了女儿身。之后遭遇种种事情,他(她)又要逆天!
2.9万字1年前
嫡女凤归:妖孽帝君快躺好 连载中
嫡女凤归:妖孽帝君快躺好
森旅酱
一朝重生,她发誓要他们血债血偿。历经背叛,她本不再相信世间情爱,只以复仇为目的。谁曾想,冒出了个死缠烂打的二皇子。“娘子,我们入洞房吧。”
6.8万字1年前
女主她不配存在 连载中
女主她不配存在
陌上的婷婷
酒卿栀内心一阵疑惑,“我不是女主吗?这是我该有的待遇?”酒卿栀可可怜怜,喜欢的茶公子竟然是是哥哥的对象。好不容易想通了,选择牺牲自己结束这一......
14.1万字1年前