多客科技 发表于 2025-11-1 15:33

告别AI黑匣子:Salesforce推出EDR智能体框架,让你实时“驾驭”企业内的AI深度研究

作者:微信文章

字数 1765,阅读大约需 9 分钟



当AI研究跑偏时,我们能做什么?

近年来,一类更强大的“深度研究智能体”(deep research agents)开始兴起,它们超越了传统的RAG系统,能像人类分析师一样分解问题、搜集证据并综合洞察。然而,尽管进步神速,这些先进的系统依然像一个“黑匣子”。一旦你设定好任务并点击“开始”,就只能袖手旁观,祈祷它不会偏离方向。如果AI中途误解了你的意图,它会继续沿着错误的路走下去,最终产出一份毫无价值的报告,白白浪费了宝贵的时间和计算资源。

为了解决这个难题,Salesforce AI Research推出了一个名为 “企业深度研究”(Enterprise Deep Research, EDR) 的全新框架。它彻底颠覆了传统模式,允许用户在AI研究智能体运行的任何阶段进行干预和引导。本文基于Salesforce AI Research最新发表的论文 《Enterprise Deep Research: Steerable MultiAgent Deep Research for Enterprise Analytics》,为你揭秘EDR框架的颠覆性亮点,看看它是如何将人从被动的观察者,转变为AI研究过程的积极“驾驶员”。


揭秘EDR框架的4个颠覆性亮点

亮点一:不再袖手旁观——你可以实时“驾驶”AI的研究方向

EDR框架最核心的创新在于其“可操控性”(Steerability)。与传统系统只能在启动前编辑一次性计划不同,EDR允许你在研究过程中的任何时刻介入,动态调整AI的航向。

这意味着,当AI的研究方向出现偏差时,你可以随时通过简单的自然语言指令进行纠正。例如,你可以输入“关注同行评审的来源”来提高学术内容的权重,或指示它“优先考虑最近的出版物”来调整研究范围。这些指令并非简单的聊天提示,而是直接作用于AI的“情境策展层”(context curation layer),通过添加、取消或重新排列任务,直接影响在每个决策点进入AI注意力的信息。这种实时干预能力,将用户从一个只能等待结果的被动观察者,转变为能够主动塑造研究过程的“情境策展人”。
亮点二:这不是一个AI,而是一个各司其职的“专家团队”

EDR的强大之处在于它并非一个单一的全能AI模型,而是一个由多个专业智能体(Agent)组成的协作系统。这个“专家团队”各司其职,共同完成复杂的深度研究任务。



团队中的关键角色包括:
• 主规划智能体(Master Research Agent): 如同团队的项目经理,负责将宏大的研究目标分解为具体可行的子任务,并协调其他智能体的工作。• 专业搜索智能体(Specialized Search Agents): 这是一支专家搜索小队,成员包括通用网页搜索、学术(Academic)搜索、GitHub代码搜索和领英(LinkedIn)资料搜索的专家,确保在各自领域搜集最精准的信息。• 可视化智能体(Visualization Agent): 负责将枯燥的数据转化为清晰直观的图表,帮助理解洞察。• NL2SQL智能体: 擅长将自然语言指令(比如“上个季度的销售额是多少?”)翻译成数据库能够理解的SQL查询语言。

这种多智能体架构确保了专业的事情由专业的智能体来处理。例如,分析代码的任务会交给理解代码仓库结构的GitHub智能体,而不是可能误解上下文的通用搜索智能体。这使得整个研究过程不仅效率更高,而且结果也更加深入、可靠且切题。
亮点三:一张公开的“待办清单”,成为人与AI的协作桥梁

EDR系统内部有一个名为todo.md的文件,它远不止是AI的内部执行计划,更是连接人类用户与AI的协作桥梁。它独创性地将结构化的任务管理与持久的笔记记录功能相结合,创造了一个人与AI共享的“工作空间”。

在这个共享空间里,todo.md文件既是AI的执行蓝图,也是人类用户的进度跟踪器。你可以随时查看、理解AI正在做什么、接下来打算做什么。更重要的是,你可以通过自然语言指令直接修改这份清单。这种设计使得AI的“思考过程”变得完全透明,让人类和AI能够围绕一个共同的、不断演进的情境进行协作,从而实现真正意义上的人机协同。
亮点四:真才实学——在权威基准测试中击败顶尖对手

EDR不仅仅是一个理论上先进的框架,它的硬实力已经在多个公开的深度研究基准测试中得到了验证。最令人惊叹的是,EDR是在完全没有任何人类实时干预的情况下取得这些成绩的。它在全自动模式下已经超越了竞争对手,而其可操控性则是一个更强大的额外优势,而非必需的辅助。EDR 框架用于所有评估的底层基础模型是 gemini-2.5-pro,同时他也支持通过环境变量配置使用如OpenAI、Anthropic Claude、Grok等模型。



在专门评估商业咨询能力的DeepConsult基准测试中,EDR与顶尖对手openai-deep research进行了成对比较。结果显示,EDR取得了高达71.57%的胜率,而失败率仅为9%。此外,在另一个权威的DeepResearch Bench测试中,它的整体得分也达到了49.86,优于大多数同类系统。这些实实在在的数据,证明了EDR框架在处理复杂研究任务时的卓越性能和先进性。
结语:从“提示”到“驾驭”,AI协作的未来形态

总结来说,Salesforce的EDR框架通过引入实时可操控性、透明的任务管理和专业化的多智能体协作,为企业级的AI研究提供了一个更可靠、更高效的全新范式。它不再是一个你无法控制的“黑匣子”,而是一个你可以并肩作战的强大助手。



目前该项目已开源,感兴趣的朋友可以访问EDR GitHub仓库获取更多信息。

以上是我今天分享的全部内容,如果你觉得有帮助,欢迎点赞、转发、收藏,让更多朋友受益。
引用链接

EDR GitHub仓库: https://github.com/SalesforceAIResearch/enterprise-deep-research
页: [1]
查看完整版本: 告别AI黑匣子:Salesforce推出EDR智能体框架,让你实时“驾驭”企业内的AI深度研究