找回密码
 注册

微信登录

微信扫一扫,快速登录

萍聚头条

查看: 287|回复: 0

AI 找到了六个 Erdos 数学问题,陶哲轩:AI + 人类专家才是真正改变科学研究的方式

[复制链接]
发表于 2025-10-18 09:50 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册 微信登录

×
作者:微信文章

AI 帮数学家找到了六个「失踪」的答案。

w1.jpg

菲尔兹奖得主陶哲轩刚刚在 Mastodon 上分享了一个有趣的发现:

六个原本被标记为「未解决」的 Erdos 数学问题,在 AI 的帮助下被发现……其实,早就有人给解决了。

这个结果来自 Erdos 问题网站上的一个 AI 实验。
Erdos 问题网站

先说说这个神奇的网站。

w2.jpg

Erdos 问题网站收录了 1000 多个保罗·埃尔德什提出的数学问题,其中约 407 个已被解决。

w3.jpg

而关于保罗·埃尔德什,他可以说是 20 世纪最多产的数学家之一。他一生提出了无数问题,还经常为解决这些问题的人提供现金奖励。

毕竟也是大学数学分析为数不多考了 100 分的人,而且我还主动修了几门数学系的课呢,于是我清了清嗓子,壮了壮胆 Random Open 了一题:

w4.jpg

然后,就关了……

说回这个 Erdos 问题网站,埃尔德什曾说:

精心选择的问题能够隔离出特定领域的本质困难,成为衡量该领域进展的基准。

他把问题分为两类:

    一类是像「棉花糖」一样提供短暂享受的简单问题

    另一类是像「橡子」一样需要深刻新见解才能长成参天大树的难题。
AI 文献搜索实验

陶哲轩在推文中解释了 AI 在数学研究中最有价值的应用方式:

不是让最强大的模型去攻克千禧年难题,而是让中等能力的 AI 去处理那些枯燥但必要的日常工作。

文献搜索就是这样一个「痛点」。

如果你研究的问题有标准名称和活跃的研究社群,现有搜索工具就够用了。

但很多数学问题没有统一的名字,相关文献零散分布,不同研究群体可能在研究同一个问题却互不知情。

用传统方法来找这些文献,简直就像是大海捞针,效率极低。

首先,你得想方设法搞到冷门期刊的论文,然后还得仔细读完一堆「可能相关」的文章,最后发现大部分都没用。

这里需要说明的是,数学家之所以是数学家,其与当前充满幻觉的生成式 AI 的核心差异在于:

一旦其找到真正相关的论文,数学家们很容易就能判断:这篇论文是否已经解决了问题?

这种「难以找到但易于验证」的特性,让文献搜索成为 AI 辅助数学研究的理想应用场景。
复活六个问题

于是在几天前,Erdos 问题网站的贡献者开始系统性地使用 AI 深度研究工具来搜索相关文献。

结果怎么样呢?

六个原本标记为「未解决」的问题,被发现……

其实,早就有人解决了!!!

这六个问题分别是:

    https://www.erdosproblems.com/339

    https://www.erdosproblems.com/1043

    https://www.erdosproblems.com/494

    https://www.erdosproblems.com/621

    https://www.erdosproblems.com/822

    https://www.erdosproblems.com/903

我贴了前两题出来:

w5.jpg

w6.jpg

并且,还有十几个问题,虽然目前看着还是没有解决,但 AI 帮助找到了相关的研究进展。
AI 数学竞赛的「虚假繁荣」

说到 AI 在数学领域的表现,不得不说说 AI 拿下 IMO 金牌的事。

今年 7 月,Google DeepMind 的 Gemini Deep Think 和 OpenAI 的模型都在国际数学奥林匹克(IMO)获得了「金牌」水平的成绩,各自解决了六道题中的五道,得分 35/42。

而人类选手中,共有五位获得了满分 42/42,其中只有一小部分选手在最难的第六题上得分。见:

DeepMind率先拿下IMO金牌,却被OpenAI 抢先发布了……

IMO 主席正式宣布:Google DeepMind在国际数学奥赛拿下金牌!

DeepMind AlphaProof 前负责人谈2025年IMO

当前最强 AI 的表现,可以说相当于顶尖的人类金牌选手了。

而此前,陶哲轩还在 6 月时怀疑过语言模型能否实时解决 IMO 问题。结果两个 AI 就在一个月后同时跨越这个里程碑,可以说是确实标志着一个重大转变,意义非凡。

但……这些竞赛对于解决真正的数学问题有多大用处呢?

答案是:没多少用。

原因在于,那些真正困难的数学问题,比如黎曼猜想、P vs NP 问题,如中国数学家张益唐在晚点播客中所言,目前还远不是 AI 所能解决的。

毕竟,训练语料里也没有这些问题的答案啊!

而这些竞赛,虽然题目难,但都是有标准解法的。相较而言,那些真正的数学研究和难题需要的,则是创造全新的理论和方法。
失败也有价值

不过 AI 对于解决大的数学问题也并非一无是处。

陶哲轩提到了一个容易被忽视的好处:AI 让报告「负面结果」变得更自然了。

以前如果你花很多时间搜索文献却一无所获,通常不会公开说出来。

毕竟,万一后来有人找到了你漏掉的论文,那得多尴尬啊!

这也就导致了,会有多位研究者可能在重复进行同样的无用功。

甚至可能更为糟的是,大家都以为某个问题还没人解决,然后一堆人类稀有的天才数学家都都偷偷各自用力在狠钻着这些问题……

但其实,答案早就在某个角落里躺着了!

这可以说,是全人类最大的内卷和浪费啊!!!

试想,此时此刻就有一堆天才的数学家,已经或即将耗时半辈子甚至一生心血去研究另一个天才已经走完了的路……想着就心疼。

w7.jpg

而用 AI 工具去系统性地处理大量问题,并报告正负两方面的结果,再由数学家来 review 一下拍个板,这事就相对容易且很有用了:

在 AI 审查的 36 个问题中,24 个(66%)找到了新的相关文献,12 个(33%)只返回了已知或无关的结果。

而这样的透明化的工作,则能让整个数学界的所有数学家们,都更加清楚地了解某个问题的研究现状。

有太多的人,总是期待 AI 能创造奇迹,解决那些人类几百年都搞不定的难题。但陶哲轩的观察则让我们看到了另一种可能是:

AI 的价值不在于取代数学家的创造性思维,而在于把数学家从繁琐的文献搜索中解放出来。

就像洗衣机,它没有让我们变成更好的人,但它确实让我们有了更多时间去做其他事。

让数学家不用再花几个月时间确认「这个问题是否已被解决」,不用再重复前人的工作,不用再重走他人误入过的死胡同,他们就能更好把精力投入到真正的创新上。

这种「中等能力 AI + 人类专家验证」的模式,虽然看起来没那么酷炫、听起来没那么多的科幻色彩——

但却可能,才是 AI 真正改变科学研究的方式。

六个 Erdos 问题被发现已经解决,这只是个开始。

而说回 AI 的真正价值,也未必就非要让它能做人类做不到的事,能让人类不必再做那些本不该由人类来做的事,少做些重复的事——

也就,足矣。


参考链接:

    Terence Tao 的 Mastodon 原文:https://mathstodon.xyz/@tao/115385022005130505

    Erdos 问题网站:https://www.erdosproblems.com/

👇

👇

👇

另外,我还用AI 进行了全网的AI 资讯采集,并用AI 进行挑选、审核、翻译、总结后发布到《AGI Hunt》的实时AI 快讯群中。

这是个只有信息、没有感情的 AI 资讯信息流(不是推荐流、不卖课、不讲道理、不教你做人、只提供信息、希望能为你节省一些时间)

欢迎加入!

w8.jpg

也欢迎加群和10000+群友交流。

w9.jpg
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
您需要登录后才可以回帖 登录 | 注册 微信登录

本版积分规则

Archiver|手机版|AGB|Impressum|Datenschutzerklärung|萍聚社区-德国热线-德国实用信息网

GMT+1, 2025-10-29 10:35 , Processed in 0.140991 second(s), 30 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表