超小小中大超大

柏拉图表示假说 (13-1)

好书推荐：数学联邦政治世界观、万人迷被强制爱的日常、惊世狂妃：皇叔一宠到底、万人迷omega被疼爱了、潜执CP（自创版）、穿书炮灰女配要修仙、黑化徒弟萌宠师、高冷冥夫宠上身、我的神宠、幻境：多元宇、

柏拉图表示假说 The Platonic Representation Hypothesis

柏拉图表示假设

Minyoung Huh, Brian Cheung, Tongzhou Wang, Phillip Isola

麻省理工学院

联系人: Minyoung Huh (minhuh@)

关键词: 机器学习, 表示, 人工智能, 多模态

译者：GPT-4o

摘要

我们认为AI模型，特别是深度网络中的表示正在趋同。首先，我们调查了文献中的许多趋同例子：随着时间的推移和跨多个领域，不同神经网络表示数据的方式越来越趋于一致。接着，我们展示了跨数据模态的趋同：随着视觉模型和语言模型的规模增大，它们测量数据点之间距离的方式越来越相似。我们假设这种趋同正在朝着一个共享的统计模型发展，类似于柏拉图的理想现实概念。我们将这种表示称为柏拉图表示，并讨论几种可能的选择压力。最后，我们讨论这些趋势的影响、局限性以及我们分析的反例。

项目页面: phillipi./prh

代码: /minyoungg/platonic-rep

引言

AI系统正在迅速发展成高度多功能的实体。例如，过去我们针对不同的语言处理任务（如情感分析、解析、对话）有专门的解决方案，而现代的大型语言模型（LLMs）使用一组权重就能胜任所有这些任务。跨数据模态的统一系统也在构建：最近的模型如GPT4-V、Gemini和LLaVA，使用结合架构处理图像和文本。越来越多的系统建立在通用预训练骨干模型基础上，这些模型支持广泛的任务，包括机器人、生物信息学和医疗。简言之，AI系统在架构和能力上变得越来越同质化。

柏拉图表示假设：神经网络在不同目标和不同数据模态下训练，正在趋同到一个共享的统计模型在其表示空间中的表现。

X ↙ ↘

⇣

→ Y

A red sphere next to a blue cone.

↓ ↓

▯ ▯

柏拉图表示假设：图像(X) 和文本 (Y) 是共同底层现实 (Z) 的投影。我们推测表示学习算法将趋同于 Z 的共享表示，并且模型规模、数据和任务多样性的扩大推动了这种趋同。

本文探讨了这一趋势的一个方面：表示趋同。我们认为在不同神经网络模型中，数据点表示的相似性在不断增加。这种相似性跨越了不同的模型架构、训练目标，甚至是数据模态。

是什么导致了这种趋同？它会继续吗？最终，它会达到什么程度？

数学联邦政治世界观提示您：看后求收藏（同人小说网http://tongren.me），接着再看更方便。