简体中文 繁體中文 English Deutsch
微信扫一扫,快速登录
TA的专栏
您需要 登录 才可以下载或查看,没有账号?注册
“我们不是靠 task-specific 微调,而是通过通用强化学习 + 增强计算规模(test-time compute scaling)突破的。” - Alexander Wei
“模型解决了 2025 IMO 的 6 道题中的 5 道,总得分 35/42,足以获得金牌。”
“这个模型是一个实验性研究模型,并不会在短期内公开。”
“我曾预测到 2025 年只能做到 MATH benchmark 的 30%,现在模型已经拿下了 IMO 金牌。”
人类专家在 2021 年对 AI 数学能力的评估,大幅低估了当前的发展速度。
使用道具 举报
本版积分规则 发表回复 回帖并转播 回帖后跳转到最后一页
Archiver|手机版|AGB|Impressum|Datenschutzerklärung|萍聚社区-德国热线-德国实用信息网
GMT+2, 2025-10-24 10:37 , Processed in 0.130167 second(s), 31 queries .
Powered by Discuz! X3.5 Licensed
© 2001-2025 Discuz! Team.