首页热点新闻正文

这个访谈回应了所有AI焦点问题！他是AI最重要论文的联合作者

热点新闻 3小时前 3

Aidan Gomez认为，LLM发展已进入平台期，简单扩大模型规模带来的边际效益正在递减，而推理能力将成为未来突破口，并将带来新的商业模式和市场机遇——从"买更大的算力"变成了"多给AI一点思考时间"。作者：硬AI 来源：硬AI AI狂飙突进的时代，真的要结束了吗？随着scaling law撞墙新闻爆出，全球科技圈、资本市场关于大模型发展触及天花板的讨论愈演愈烈。那么，AI发展是否放缓？后续又将如何发展？商业模式如何突破？针对一系列焦点问题，人工智能领域最具影响力的论文《Attentio

Aidan Gomez认为，LLM发展已进入平台期，简单扩大模型规模带来的边际效益正在递减，而推理能力将成为未来突破口，并将带来新的商业模式和市场机遇——从"买更大的算力"变成了"多给AI一点思考时间"。

作者：硬AI

来源：硬AI

这个访谈回应了所有AI焦点问题！他是AI最重要论文的联合作者

AI狂飙突进的时代，真的要结束了吗？

随着scaling law撞墙新闻爆出，全球科技圈、资本市场关于大模型发展触及天花板的讨论愈演愈烈。那么，AI发展是否放缓？后续又将如何发展？商业模式如何突破？

针对一系列焦点问题，人工智能领域最具影响力的论文《Attention Is All You Need》的联合作者，Cohere联合创始人兼CEO Aidan Gomez在访谈中分享了自己对AI发展的深度见解。

他认为，LLM发展已进入平台期，而推理能力将成为未来突破口，并将带来新的商业模式和市场机遇。同时，他也提醒投资者警惕模型价格倾销，关注 AGI 发展趋势。

对于scaling law放缓的问题，Gomez认为，简单扩大模型规模带来的边际效益正在递减。以绘画为例，Gomez指出 LLM 的发展初期如同用大笔触快速完成基础构图，但随着模型需要处理更精细的任务，如同绘画需要越来越细的笔触来完善细节，模型改进需要的数据也越来越精细，这导致获取高质量数据的成本越来越高，最终模型的规模化发展将受限于人类知识的边界和专家数据的获取难度。

推理能力方面，Gomez表示，推理能力可以让 LLM 不仅简单地记忆输入输出对，还可以像人类一样进行多步骤的思考和推理，解决更复杂的问题。而这，这带来了一个革命性的变化——企业不必再为提升AI能力投入巨额固定成本，而是可以通过增加推理时间来实现。用通俗的话说，就是从"买更大的算力"变成了"多给AI一点思考时间"。

Gomez还认为，推理时间计算量的增加还将对芯片层和数据中心建设产生影响，未来需要开发更适合处理推理任务的芯片，以及建设更适合分布式计算的数据中心。

以下是访谈内容精编：

LLM发展进入平台期，推理能力将成未来突破口

问：LLM 发展是否已经进入平台期？未来的突破口在哪里？

Gomez：

LLM 性能提升已进入平台期，边际效益递减。 [2， 6] 简单地扩大模型规模带来的性能提升有限，就像油画创作从大笔触的构图阶段进入到需要用越来越细的笔触来完善细节的阶段。
模型改进需要越来越精细的数据。 LLM 在处理简单、常见的任务时可以快速提升，但在处理更专业、敏感的领域（如科学、数学）时，性能提升的难度越来越大，因为需要更精细、专业的数据来训练模型。
推理能力将成为 LLM 未来发展的新突破口。 [3， 5] 推理能力可以让 LLM 不仅简单地记忆输入输出对，还可以像人类一样进行多步骤的思考和推理，解决更复杂的问题，例如多项式求解。

问：影响模型规模化发展的因素有哪些？

Gomez：

合成数据可以帮助模型在某些领域（如代码、数学）提升性能。因为这些领域的答案易于验证，可以通过合成大量数据来训练模型。
但在其他需要真实世界知识的领域（如生物学、化学），数据的获取难度更大，需要依赖专家知识。
最终，模型的规模化发展将受限于人类知识的边界和专家数据的获取难度。

2. 推理能力将带来新的商业模式和市场机遇

问：推理能力将如何改变行业格局？

答：

推理能力的出现将带来新的商业模式。
客户可以通过增加推理时间计算量来获得更智能的模型，而无需等待数月进行新的模型训练。这意味着客户可以根据需求灵活地调整模型性能，获得更好的产品体验。
这种从资本支出（CAPEX）模式到消费模式的转变将吸引更多客户投资于解决问题，而无需承担高昂的训练成本和时间成本。
推理时间计算量的增加还将对芯片层和数据中心建设产生影响，未来需要开发更适合处理推理任务的芯片，以及建设更适合分布式计算的数据中心。

问：如何理解推理能力？

答：

目前的 LLM 缺乏像人类一样的“内心独白”，无法进行多步骤的推理思考。它们只能根据输入直接给出输出，而不能像人类一样在解决问题时进行思考、尝试、纠错，最终找到解决方案。
推理能力的加入将使 LLM 可以像人类一样进行多步骤的思考和推理。这种能力将通过使用人类数据和合成数据，明确地收集人们的内心想法并进行训练来实现。

问：什么类型的问题更适合使用推理能力解决？

答：

这个访谈回应了所有AI焦点问题！他是AI最重要论文的联合作者