柏拉图表示假说 (13-10)

好书推荐：数学联邦政治世界观、万人迷被强制爱的日常、惊世狂妃：皇叔一宠到底、高冷冥夫宠上身、潜执CP（自创版）、穿书炮灰女配要修仙、万人迷omega被疼爱了、黑化徒弟萌宠师、我的神宠、幻境：多元宇、

所有这些论点不仅适用于 $X$，也适用于 $Y$（或任何其他双射离散模态），这意味着：Kpmi(zα，zb)＝〈fx(xα)，fx(xb)〉– cx

＝〈fʏ(yα)，fʏ(yb)〉– cʏ .

因此，在我们的理想化世界中的任何模态中，我们观察到表示趋同于相同的核，代表了ℙ(Z) 的某些成对统计量。

这种分析表明，某些表示学习算法可能归结为一个简单规则：找到一个嵌入，使相似度等于PMI。我们注意到这个想法与之前使用PMI作为视觉和语言聚类相似性度量的工作一致。

颜色研究

我们进行了一项案例研究，以验证趋同确实发生在实际数据上。Abdou et al. (2021) 发现，当训练语言表示以预测文本中的共现时，这些表示中的颜色距离与人类感知的颜色距离非常接近，我们在 Figure 8 中再现了这一点，包括对比和预测模型。有趣的是，他们注意到，随着模型变得更大和在建模文本共现上变得更好，相似性增加。在 Figure 8 中，我们还基于 Kpmi 学习了图像中的共现表示。确实，在任何一个领域中学习共现统计会恢复大致相同的知觉表示。此实验的详细信息见 Appendix D.。

我们相信，我们的简单模型概括了复杂现实系统的基本方面，并为理解模型趋同到的表示提供了一条路径——一个在各个领域和模态中都很熟练的统一模型，基于底层世界的统计属性。第6节进一步详细阐述了一些局限性。

趋同的意义是什么？

扩展是充分的，但不一定是高效的

我们的论点大致与“规模即一切”的主张一致，即达到高水平的智能。我们已经论证了，随着资源的扩展（参数数量、数据点数量、计算量），表示正在趋同，无论其他建模选择和数据模态如何。这是否意味着规模是一切？并非如此：不同的方法可以以不同的效率扩展，成功的方法仍需满足一些一般要求（例如，成为一致估计器，建模 ℙ(Z) 的成对统计）。

训练数据可以跨模态共享

假设你可以访问N 张图像和 M 句子，并希望学习最佳表示。如果确实存在一个模态无关的柏拉图表示，那么图像数据应该有助于找到它，语言数据也是如此。这意味着，如果你想训练最佳视觉模型，你不仅应该训练 N 张图像，还应该训练 M 句子。这已经成为常见做法。许多视觉模型从预训练的LLMs中微调。另一方向较少见，但也符合我们的假设：如果你想构建最佳LLM，你也应该在图像数据上训练它。事实上，Achiam et al. (2023) 声称有证据表明，训练图像可以提高文本性能。理论上，应该有一些转换比率：一个像素在训练LLMs时相当于 α 个词，一个词在训练视觉模型时相当于 b 个像素。

跨模态翻译和适应的容易性

数学联邦政治世界观提示您：看后求收藏（同人小说网http://tongren.me），接着再看更方便。

相关小说

连载中

风是自由的，愿你是风: 花外; 纯属虚构; 1.0万字9个月前

连载中

转学生的窝别帅帅男银追求啦: 妖也是妃; 尧轻轻善良坚强，柔弱美丽，是一个笨蛋美人。她转学到一座贵族学校，作为学校中的特招贫困生尖子学霸，她的到来，掀起一场名为“轻轻争霸赛”的浪潮！......; 0.2万字9个月前

连载中

美人师尊养徒为患: 柒笙99; 当举世无双的翩翩公子救回沉默寡言的冷酷少年，二人之间将碰撞出怎样的火花？当受尽凌辱的少年被感化，这心中暗生的情愫又将如何诉说？巨大的阴谋编织......; 2.3万字9个月前

连载中

寂寞的含义在五个时空说爱你: 天鹅儿; 暂时弃坑处理！！！！勿看！！！『Shine文社』生而闪耀，璀璨人生.——————————————该文描述了缪芩佛祖即墨熙与鬼殿战神寒奕的五生......; 33.9万字9个月前

连载中

杂闻录之无奇不有2: 若雪……; 来自树屋的故事我，白晓晓，一个打工仔意外得到一本游戏早晨，是忙里忙外，干劲满满的女仆夜晚，是贯穿游戏剧本的……女配角？“什么啊，怎么又是你”......; 10.7万字9个月前

连载中

深山悠闲: 请叫我小欧欧; 当现代女特工魂穿6岁小豆丁，唯一的金手指就只有力气越来越大还没有上限; 8.4万字9个月前