AI的下半场:

新闻 · 发表于 2025-11-29 12:53

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区。

您需要登录才可以下载或查看，没有账号？注册

×

作者：微信文章
今年上半年，OpenAI研究员姚顺雨发布了一篇有名的博文《The Second Half》，宣告AI主线程的游戏已进入下半场。这篇文章论述了AI上半场和下半场的界定，也给了我们一个很好的思考锚点。

AI的上半场发生了什么？

从击败国际象棋和围棋世界冠军，到在 SAT 和律师资格考试中超越大多数人类，再到赢得国际数学奥林匹克竞赛（IMO）和国际信息学奥林匹克竞赛（IOI）金牌。这些载入史册的里程碑——深蓝、AlphaGo、GPT-4 和 O 系列——背后，是人工智能方法论的根本性创新：搜索、深度强化学习、扩展和推理。

2012：AlexNet 震惊世界 → 深度学习时代开启

2014：GAN（生成对抗网络）诞生

2014–2015：Seq2Seq、Attention 雏形出现

2015：DeepMind DQN 打通 Atari 游戏

2016：AlphaGo 战胜李世石

2017：AlphaGo Zero → 自我博弈时代

2017：Transformer 论文问世

2018：BERT 引爆预训练革命

2019：GPT-2 发布

2020：GPT-3 → 参数规模首次跳到百亿级

2021：Diffusion 模型兴起（Stable Diffusion 前身）

2021–2022：多模态开始突破

2022.11：ChatGPT 3.5的发布

2023：GPT-4、Claude、PaLM 2……全面进入大模型时代

回顾一下过去几年的关键事件，我们可以发现，人工智能的研究重点在于构建新的模型和训练方法。

在过去的研究逻辑中，为了解决一类问题，研究员们收集数据、改进训练方式、获得更好的模型......因为有新的训练方式的突破，出现了新的模型，解决了一类问题。

然而，从现在往回看，是不是事情可以反过来，只要获得了更好的模型，原来的一些基础问题，可以很简单的被解决。

举个例子，为了解决最短时间走完迷宫这个问题，我们设计了训练数据、优化了训练方式，最终得到了可以完美完成任务的模型，但是，这个模型可以走迷宫，却不能完成拼图游戏。这是为什么呢？

原因在于——模型缺少泛化能力。

然而，现在，

强化学习实现了泛化能力。LLM具有了推理能力。

那么，假设我们一开始训练的模型，就不是解决单一问题的模型，而是训练一个拥有人类先验知识的模型，根据模型的泛化能力，它是不是能够轻而易举的完成迷宫游戏、拼图游戏、以及其他更加复杂的游戏？

人工智能在商业应用的问题

很早之前，人工智能已经击败了国际象棋和围棋的世界冠军，在 SAT 和律师资格考试中超越了大多数人类，并在国际智力竞赛和国际数学奥林匹克竞赛中取得了金牌。但从经济和 GDP 来看，世界并没有发生太大变化。这背后的原因是什么呢？姚顺雨认为，这是效用问题 ——是人工智能面临的最重要的问题。

之前的AI应用，大多还是基于模型能力，围绕模型能力的边界来去生产现实世界的应用。如：AlphaGo、人脸识别、自动驾驶等。

AI的下半场可能会怎么发展？

姚顺雨提出，人工智能的后半程——从现在开始——将把重点从解决问题转移到定义问题。

在这个新时代，评估比训练更重要。我们不再仅仅问“我们能否训练一个模型来解决 X 问题？”，而是问“我们应该训练人工智能做什么，以及如何衡量真正的进展？”

从根本上重新思考评估方式。这不仅意味着要制定新的、更严格的基准，还要从根本上质疑现有的评估体系，并创建新的体系，从而迫使我们突破既有模式，探索新的方法。

一旦打破常规，就有可能出现新的模式。

Maybe，AaaS（Agent-as-a-Service）.

相关论文🔗：

https://ysymyth.github.io/The-Second-Half/

账号		自动登录	找回密码
密码			注册

AI的下半场:

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区。

浏览过的版块