今天我们分享解读的是来自广东人工智能与数字经济实验室(深圳)、深圳大学、中山大学以及法国巴黎综合理工学院等顶尖研究机构的学者联合撰写的最新万字综述——《Exploring Embodied Multimodal Large Models: Development, Datasets, and Future Directions》。
随着大模型的浪潮席卷而来,这一古老而深刻的哲学思想与最前沿的技术产生了激烈的碰撞,催生了具身多模-态大模型(Embodied Multimodal Large Models, EMLMs)。EMLMs旨在将大模型的强大推理能力与多模态感知(视觉、语言、听觉、触觉等)和物理行动能力结合起来,创造出能够在真实或虚拟世界中自主行动的智能体。