找回密码
 注册

Sign in with Twitter

It's what's happening?

微信登录

微信扫一扫,快速登录

查看: 458|回复: 0

【AI研究所】谷歌刚刚发布11月最新Agents白皮书,从预测式AI到自主智能体,智能体发展五个层级

[复制链接]
发表于 2025-11-24 13:19 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册 微信登录

×
作者:微信文章
谷歌2025年11月刚刚发布的Agents白皮书《Introduction to Agents》,无疑为通用人工智能(AGI)的路径探索提供了前瞻性的架构性思考。该白皮书的核心在于描绘了从传统预测式AI向自主智能体(Autonomous Agents)的范式迁移,强调了Agent在复杂多步骤任务处理中的自主规划与执行能力,并提出了一个分层的能力发展模型。

w1.jpg

w2.jpg

传统预测式AI系统通常基于预训练模型对输入进行映射预测,其任务执行边界由明确的API调用或固定的决策树所限定。而自主智能体的核心突破在于其实现了“目标驱动的闭环控制”,即在无需人类每一步具体指令的条件下,能够自主地制定计划、采取行动并动态调整以追求预设目标。这得益于大型语言模型(LLMs)在推理(Reasoning)能力上的显著增强,使其得以从单纯的模式识别器演进为具备规划(Planning)和执行(Execution)能力的智能实体。

白皮书详细阐述了自主智能体在任务执行中的五步核心流程:

1、任务接收与场景理解

Task Reception & Context Understanding

Agent首先接收高级别任务指令,并结合对当前环境、上下文信息的深入分析,基于内嵌的知识图谱或外部数据进行推理,构建任务的初始表征与潜在解空间。

2、推理与规划

Reasoning & Planning

基于场景理解,Agent利用LLM的强大推理能力,将复杂任务分解为一系列可执行的子任务,并构建一个多步行动序列,即生成具体的执行计划。这一过程可能涉及启发式搜索、基于效用的决策等。

w3.jpg

3、工具调用与操作执行

Tool Invocation & Operation Execution

Agent将规划的行动转化为对外部工具(如RESTful APIs、Web Search Engines、Database Queries、Code Interpreters等)的具体调用和操作。这是将抽象规划转化为具象行动的关键环节。

4、观察与反馈

Observation & Feedback

Agent执行操作后,会实时捕获环境反馈(Observation),评估行动结果与预期目标之间的偏差。这种反馈机制是实现闭环控制的基石。

5、持续改进与迭代

Continuous Improvement & Iteration

基于观察到的反馈,Agent会重新评估当前状态和计划的有效性,并在必要时对计划进行修正、优化甚至重新规划。这种迭代循环是自主智能体适应动态环境、处理不确定性的核心能力。

w4.jpg

为了更系统地理解自主智能体能力的演进,白皮书提出了一个五层级发展模型:

L0:核心推理系统(Core Reasoning System)——语言模型(LLM)

处于最底层,是Agent的认知基石。LLM提供基础的语言理解、生成、解释和少样本推理能力。其本质上是一个强大的模式匹配和生成器,能够从海量数据中学习到复杂的语义关联。

L1:工具连接问题求解者(Tool-Connected Problem Solver)

在L0基础上,Agent获得了调用外部工具的能力。通过集成外部API、搜索引擎、数据库接口等,LLM能够突破其自身知识边界,获取实时信息或执行特定计算,从而解决更广泛的问题。这一层级标志着LLM从纯粹的“文本处理器”向“功能执行器”的转变。

L2:策略问题求解者(Strategic Problem Solver)

这一层级的Agent不仅能调用工具,更具备复杂的任务规划、多步推理以及上下文管理(Context Management)能力。白皮书强调的“上下文工程(Context Engineering)”在此发挥关键作用,Agent能够维护任务的长期记忆、管理对话历史和执行状态,确保在复杂任务中保持一致性和连贯性。这使得Agent能够执行更深层次的策略性思考和决策。

L3:协作型多智能体系统(Collaborative Multi-Agent System)

在L2能力之上,Agent系统实现了分布式智能与组织结构化。一个中央的“项目管理智能体”负责协调多个专职智能体(例如,研究Agent、编程Agent、市场Agent等)。每个专职Agent专注于特定领域任务,通过内部通信和协调机制,共同完成超大规模、高复杂度的综合任务。这体现了Agent在复杂系统中的宏观协调与任务分解能力。

L4:自进化智能体(Self-Evolving Agent)

这是Agent能力的终极形态。L4 Agent不仅能完成给定任务,更具备元学习(Meta-Learning)、自我反思(Self-Reflection)与自主优化(Self-Optimization)能力。它能分析自身性能缺陷,从经验中学习新知识,调整内部决策逻辑,甚至自主创建新的目标和方法。这一层级标志着Agent具备了持续的、无需人类直接干预的自我改进与能力提升能力,向真正的通用人工智能迈出了关键一步。

w5.jpg

谷歌的这份白皮书不仅是对当前Agent技术栈的系统性梳理,更是对未来AGI发展路径的具象化展望。它预示着AI将从被动响应的工具,演变为能够自主学习、规划与执行的智能实体,这对软件工程、自动化、人机交互乃至整个社会生态都将产生深远影响。理解这些层级与机制,对于从业者把握未来AI发展脉络,构建更具鲁棒性与智能化的Agent系统至关重要。

发送【谷歌白皮书】领取《introduction to Agent》谷歌智能体白皮书

w6.jpg

w7.jpg

w8.jpg

w9.jpg

w10.jpg

w11.jpg
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
您需要登录后才可以回帖 登录 | 注册 微信登录

本版积分规则

Archiver|手机版|AGB|Impressum|Datenschutzerklärung|萍聚社区-德国热线-德国实用信息网

GMT+1, 2025-12-10 06:44 , Processed in 0.099457 second(s), 31 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表