作者:微信文章
人类的智能并非生来就有,而是通过与环境不断互动、感知和行动逐渐形成的。这种"具身认知"理论认为,真正的智能不仅来自被动观察,更源于身体与世界的主动交互。由"AI教母"李飞飞教授领衔,斯坦福大学、西北大学和UCLA的研究团队在最新论文《ENACT: Evaluating Embodied Cognition with World Modeling of Egocentric Interaction》中发起了一场对当前AI本质能力的深度拷问:那些在各类考试中表现优异的视觉语言模型(如GPT-5、Gemini),是否真正理解物理世界中"动手"交互的含义?这项突破性研究不仅为评估AI的具身认知能力提供了严谨框架,更揭示了一个令人警醒的事实:即使最前沿的AI系统,在"动手思考"方面也与人类有着本质差距。
具身认知:从被动观察到主动交互