在新时代评估比训练更重要。不应该只是问“我们能训练一个模型解决 X 问题吗?”更应该转向“我们应该训练 AI 做什么?我们应该如何衡量真正的进步?”心态和技能从关注技术的研究员视角转变为用户和问题解决视角的产品经理视角。
上半场:以方法为核心的时代
在 AI 的上半场,研究的重心在于训练更强大的模型、发明更高效的算法。论文引用量的分布可以说明这一点:
模型训练和方法的论文引用量显著高于基准或任务的引用量。
为什么会这样?
A great new method can hillclimb many different benchmarks because it’s simple and general, thus the impact tends to go beyond an individual task. 一个好的新方法可以在很多 benchmark 上爬山,因为它足够通用、足够简单,因此能产生超出单一任务的影响力。