找回密码
 注册

Sign in with Twitter

It's what's happening?

微信登录

微信扫一扫,快速登录

查看: 224|回复: 0

AI的下半场:

[复制链接]
发表于 2025-11-29 12:53 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册 微信登录

×
作者:微信文章
今年上半年,OpenAI研究员姚顺雨发布了一篇有名的博文《The Second Half》,宣告AI主线程的游戏已进入下半场。这篇文章论述了AI上半场和下半场的界定,也给了我们一个很好的思考锚点。



AI的上半场发生了什么?



从击败国际象棋和围棋世界冠军,到在 SAT 和律师资格考试中超越大多数人类,再到赢得国际数学奥林匹克竞赛(IMO)和国际信息学奥林匹克竞赛(IOI)金牌。这些载入史册的里程碑——深蓝、AlphaGo、GPT-4 和 O 系列——背后,是人工智能方法论的根本性创新:搜索、深度强化学习、扩展和推理。

2012:AlexNet 震惊世界 → 深度学习时代开启


    AlexNet 在 ImageNet 比赛中碾压传统方法

    GPU(尤其 NVIDIA)成为 AI 加速的主力

    计算机视觉快速爆发


2014:GAN(生成对抗网络)诞生


    Ian Goodfellow 提出 GAN

    生成式模型时代萌芽

    后来 DALL·E、Stable Diffusion 的理论基础


2014–2015:Seq2Seq、Attention 雏形出现


    深度学习开始进入 NLP

    机器翻译、文本生成取得突破


2015:DeepMind DQN 打通 Atari 游戏


    强化学习首次在像素级游戏上达到超人水平

    开启 DRL(深度强化学习)时代


2016:AlphaGo 战胜李世石


    全球 AI 认知被刷新

    深度学习 + 蒙特卡洛树搜索 + 强化学习 的胜利

    AI 开始影响大众认知


2017:AlphaGo Zero → 自我博弈时代


    不依赖人类数据,仅靠自己训练

    显示了 AI 从“学习人类”到“超越人类”的趋势


2017:Transformer 论文问世


    《Attention is All You Need》

    彻底改变 NLP 技术路线

    去掉 RNN/Seq2Seq,全部基于注意力


2018:BERT 引爆预训练革命


    Google 发布 BERT

    NLP 大幅性能提升

    “预训练 + 微调”成为新范式


2019:GPT-2 发布


    展现了语言生成的惊人能力

    虽然被称作 “太危险不开放”,但标志着 LLM 方向的可行性


2020:GPT-3 → 参数规模首次跳到百亿级


    175B 参数

    Zero-shot、Few-shot 技能首次出现

    业界意识到:Scaling Law(规模定律)能自己涌现能力


2021:Diffusion 模型兴起(Stable Diffusion 前身)


    DDPM、CLIP、VQ-VAE

    文生图开始显现潜力


2021–2022:多模态开始突破


    CLIP(OpenAI):理解图像与文字的关系

    DALL·E / DALL·E 2:AI 绘画雏形

    Flamingo:多模态基础模型


2022.11:ChatGPT 3.5的发布


    RLHF(人类反馈强化学习)首次大规模应用

    让 AI “能说人话”

    引发全球产业链重构


2023:GPT-4、Claude、PaLM 2……全面进入大模型时代


    GPT-4:更强的推理、语言理解和工具使用能力

    大模型平台化(API、插件、Agent)

    文生图、视频生成、声音生成全面爆发


回顾一下过去几年的关键事件,我们可以发现,人工智能的研究重点在于构建新的模型和训练方法。

在过去的研究逻辑中,为了解决一类问题,研究员们收集数据、改进训练方式、获得更好的模型......因为有新的训练方式的突破,出现了新的模型,解决了一类问题。

然而,从现在往回看,是不是事情可以反过来,只要获得了更好的模型,原来的一些基础问题,可以很简单的被解决。

举个例子,为了解决最短时间走完迷宫这个问题,我们设计了训练数据、优化了训练方式,最终得到了可以完美完成任务的模型,但是,这个模型可以走迷宫,却不能完成拼图游戏。这是为什么呢?

原因在于——模型缺少泛化能力。

然而,现在,

强化学习实现了泛化能力。LLM具有了推理能力。

那么,假设我们一开始训练的模型,就不是解决单一问题的模型,而是训练一个拥有人类先验知识的模型,根据模型的泛化能力,它是不是能够轻而易举的完成迷宫游戏、拼图游戏、以及其他更加复杂的游戏?



人工智能在商业应用的问题



很早之前,人工智能已经击败了国际象棋和围棋的世界冠军,在 SAT 和律师资格考试中超越了大多数人类,并在国际智力竞赛和国际数学奥林匹克竞赛中取得了金牌。但从经济和 GDP 来看,世界并没有发生太大变化。这背后的原因是什么呢?姚顺雨认为,这是效用问题 ——是人工智能面临的最重要的问题。

之前的AI应用,大多还是基于模型能力,围绕模型能力的边界来去生产现实世界的应用。如:AlphaGo、人脸识别、自动驾驶等。



AI的下半场可能会怎么发展?



姚顺雨提出,人工智能的后半程——从现在开始——将把重点从解决问题转移到定义问题。

在这个新时代,评估比训练更重要。我们不再仅仅问“我们能否训练一个模型来解决 X 问题?”,而是问“我们应该训练人工智能做什么,以及如何衡量真正的进展?”

w7.jpg

从根本上重新思考评估方式 。这不仅意味着要制定新的、更严格的基准,还要从根本上质疑现有的评估体系 ,并创建新的体系,从而迫使我们突破既有模式,探索新的方法。

w8.jpg

一旦打破常规,就有可能出现新的模式。

Maybe,AaaS(Agent-as-a-Service).

相关论文🔗:

https://ysymyth.github.io/The-Second-Half/
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
您需要登录后才可以回帖 登录 | 注册 微信登录

本版积分规则

Archiver|手机版|AGB|Impressum|Datenschutzerklärung|萍聚社区-德国热线-德国实用信息网

GMT+1, 2025-12-19 05:57 , Processed in 0.088544 second(s), 31 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表