AI Agent,你不懂的都在这里

我爱免费 · 发表于 2025-11-8 23:54

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区。

您需要登录才可以下载或查看，没有账号？注册

×

作者：微信文章
一、前言——LLM

LLM的发展可以追溯到20世纪中叶的自然语言处理研究，但真正形成现代LLM的关键在于深度学习和大数据的结合。早期，语言模型主要基于规则系统和同级方法，例如n-gram模型（基于词频统计预测下一个词）。这些模型简单但是很局限，没有办法处理复杂的语义。

早期LLM如BERT（Google于2018研发）和GPT-1（OpenAI于2018开发）就是基于Transformer的变体。

二、从LLM到AI Agent

AI从被动响应系统向主动智能代理的转变，这一过渡源于LLM的核心局限性。LLM基于Transformer架构，如Decoder-Only模型，擅长处理序列数据并生成文本，但它们本质上是静态的预测引擎，仅靠预训练数据和上下文窗口（Contest Window）来输出响应，无法与外部环境交互或执行多步策略。这就催生出了AI Agent的定义：一个以LLM为基础模型（Foundation Model），集成规划、工具调用和反馈循环的自制系统，能够分解任务、调用外部API并迭代优化结果。（POMDPs中也提到，AI Agent旨在实现从L0到L5的自治水平）
💦LLM的局限性

技术定义视角

AI Agent基于2023 年 Yao 等人的《Reasoning and Acting》论文，可以形式化为一个元组｛M，P，T，Mem，Exec｝：

M是核心LLM；

P是规划模块；

T是工具集；

Mem是记忆系统；

Exec是执行引擎；

不同于传统规则_based Agents（例如FSM聊天机器人），AI Agent强调自主性，利用LLM“涌现”的能力（比如In-Context Learing）学习而无需参数更新。LangChain Expression Language与Multi-Agent Conversation对于这一块的定义已经标准化了

以上提到的种种局限使得LLM在复杂场景中能力不足，但AI Agent通过集成这些技术实现了必要的“思考”到“行动”的转变。这一过渡不仅提升了效率，还引入了安全性考虑——例如Constitutional AI（Anthropic使用Self-Critique Prompts）能够确保Agent输出符合伦理规范。

三、有哪些关键组件

核心模型

AI Agent的“大脑”，负责处理自然语言输入、生成推理和决策输出。目前主流Mixture-of-Experts（MoE）架构（例如GPT-5、Grok4）通过动态激活专家子模块实现高效的推理，主要包含以下技术：Tokenization + Embedding、注意力机制、强化学习对齐（RLHF、DPO）
规划模块（Planning Module）

负责任务分解、路径探索和动态调整，支持Agent从反应式转向主动式。核心是Reasoning Engine，通过CoT提示技术逐步生成思维链。今年ReAct（Reasoning and Acting）框架标准是最普遍的——交替进行推理和行动，再结合1Relection Prompting反思失败原因。
🌟关键名词

任务分解：使用Decomposition 技术或Least-to-Most Prompting，把复杂目标拆分为子任务序列。

规则优化：集成GoT用图结构表示计划，支持并行探索；或者使用分层规划再多代理系统中分配角色。

适应性：通过奖励机制评估计划质量来自我修正
工具集

Agent通过工具集获取了与外部世界交互的能力，核心是在于FunctionCalling或Tool Calling API（核心是通过JSON等结构化维护参数）——最近的比如OpenAI的Atlas，Perplexity AI。
记忆模块

通过存储与检索上下文，长期的学习能够比买呢Agent重复工作。主要分为Short-Term Memory（基于LLM的Context Window）和Long-Term Memory（RAG）——核心是通过Fine-Tuning或In-Context Learning来更新记忆保存有价值的内容。

目前更多基于感知和执行的组件更多的在智能化原件上（智驾、机器人、陪伴娃娃），将更多的多模态数据与模型进行交互，这些是正在实时发生的改变。

四、Agent的工作流程

本质上AI Agent是一个动态的、迭代的循环系统（常见架构LangGraph/AutoGen）

五、未知与机遇

——写给 2035 年的你

十年后，你打开手机，屏幕自动亮起：“早，昨晚我替你把 Q3 财报、孩子作业、父母体检报告全部跑完，还顺手帮你妈把社区团购砍价到 6 折。” 这就是 Andrej Karpathy 在 2024–2025 年连续 7 条 X 线程里反复强调的终极图景：Agent 不再是工具，而是你的人生操作系统。

他把未来拆成四层确定性：

“LLM 是键盘，Agent 是电脑；键盘已死，电脑已活。”

今天，你还需手动 Prompt；

明天，Agent 会替你写 Prompt；

后天，它会替你活。

把这 300 字存进时间胶囊，2035 年打开，

你会发现：

我们不是在迎接 Agent 时代，

我们只是提前 10 年搬进了它。

账号		自动登录	找回密码
密码			注册

萍聚头条

AI Agent,你不懂的都在这里

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区。

浏览过的版块