找回密码
 注册

Sign in with Twitter

It's what's happening?

微信登录

微信扫一扫,快速登录

查看: 301|回复: 0

ai时代的一点点思考和回答

[复制链接]
发表于 2026-1-28 20:25 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册 微信登录

×
作者:微信文章
一、老问题:到底谁更容易存活?

无论是阿里的AgentScope、Qwen-Agent,还是Dify、扣子,争论的焦点其实只有一个:“到底让AI像人一样思考,还是让它像机器一样执行?”现实很冷酷:
    绝大多数企业,现在连“把死板的流程自动化”都没做好,根本不奢望 AI 帮他们“思考”;真正商用的前提只有一个:以最小的成本落地,而不是模型有多聪明。
二、短期现实:工作流完胜

企业要的是“确定性”,不是“概率”。- Agent的本质:概率性+高度灵活。它像一个“聪明但不稳定的实习生”:
    90% 的时候,它很聪明;10% 的时候,会“幻觉”,比如自动退给客户 100 万。工作流的本质:确定性 + 高度可控。
它像“标准化产线”,死板,但每一步都可审计、可回滚。所以,当前阶段:
    n8n、Dify 这类“确定性编排工具”,比“纯 Agent 平台”更好卖;大多数企业只要“自动流程”,而不是“会思考的 AI 员工”。
三、中期方向:Agentic Workflow—— 显性化的思考链

纯工作流太死,纯Agent太野,中间的折中方案,是“代理工作流”(Agentic Workflow)。核心思想:把原本藏在LLM黑盒里的“思考过程”,拆解成可视化、可控的步骤。典型模式包括:1)反思循环(Self-Refine)

    先让 Agent 生成一个初稿;再让它自己检查:“刚才的回答有没有问题?有没有违背规则?”;根据检查结果,自动生成修正版;类似你在扣子里搭一个“LLM 节点 → 评分 → 条件分支 → 重生成”的闭环。
2)工具学习

    Agent 通过试错,学会:什么时候该用“搜索”;什么时候该用“数据库查询”;什么时候该用“计算器/代码解释器”;工作流负责“调度的逻辑”,Agent 负责“如何用工具”。
3)规划拆解

    面对复杂任务(比如“策划一次 618 大促”),先拆成:竞品分析 → 预算分配 → 素材生成 → 排期表;每一步都由单独的 Agent 子任务完成,由工作流串联与校验。
4)多智能体协作

    让“策划 Agent”提方案;“财务 Agent”砍预算;“法务 Agent”审合规;三者在工作流里“辩论”,最后输出综合版本。
一句话总结:未来的工作流,不是简单的“API拼接”,而是“思维链的可视化代码”。四、产品形态:谁包含谁?

1)工作流包裹Agent(微软/B端视角)

    核心理念:业务流程是“宪法”,AI 只是其中一个“律师”;典型流程:用户提交报销单 →系统用代码校验金额、规则 →Agent 用 LLM 分析备注是否违规 →系统执行打款;AI 被锁在流程中的某个节点,干完活就把结果交还给主程序,不能乱跑。
2) Agent包含工作流(扣子/Coze/C端视角)

    核心理念:用户面对的是一个“拟人机器人”,工作流只是它的“技能”;场景:你对 Bot 说“帮我订一张票”,Bot 内部触发“订票工作流”;为什么扣子里有时候“不能插入智能体”?因为你在写 Workflow 时,自己已经是“上帝视角的 Agent”:你直接安排 HTTP、代码、LLM 节点,就是显式写好了“思考过程”,再插入一个“Agent”反而会逻辑冗余。
3)谁是标准答案?

    不是“非黑即白”,而是视角错位:对企业系统来说,工作流是主线,Agent 是插件;对 C 端用户来说,智能体是主线,工作流只是技能的内部实现。
长期来看,主流形态会是:
    “工作流包裹着的 Agent”:规则写在流程里;智能落在节点里;人类守着“执行按钮”和“回滚日志”。
刚刚厘清了"工作流包裹Agent"还是"Agent包含工作流"的形态之争——但这只是解决了"AI如何执行"的问题。真正的挑战在于:如何让AI真正"懂"你的业务?一个只会调用API的Agent,和一个能理解"供应商违约风险需关联历史诉讼+财务报表+行业舆情"的Agent,差距不在工作流编排技巧,而在知识理解的深度。这正是RAG(检索增强生成)要解决的起点:把企业散落在合同、邮件、数据库里的"业务知识"喂给AI。但传统RAG像在图书馆按书名找书——能找到《供应商A合同》,却串不起"合同→违约→诉讼→行业影响"这条链。于是,走向三个关键技术升级:GraphRAG:把碎片知识织成"关系网",支持多跳推理;DoRA:用更低成本把通用模型"调校"成懂你行业术语的专家;联邦学习:在不泄露数据的前提下,让多方知识协同训练。下一篇,拆解这些技术如何让AI从"工具使用者"进化为"业务理解者"。---一、RAG的进化:从“外挂”到“导航仪”

传统RAG做的是两件事:1)把文档切成小段,转成向量,放进向量库;2)用户提问时,按相似度捞出几个片段,再交给大模型生成答案。问题:
    不同文档之间“谁认识谁”,向量检索看不见;多跳推理问题,比如:“A 的投资人是谁?他投资了哪些新能源公司?”
传统RAG很难把“人物—投资—公司”串联起来。未来的RAG更像一个“导航仪”:
    不只是告诉你“附近有什么”,还要告诉你“从 A 到 B 的路径是什么”。
二、名词解释:GraphRAG(图谱增强检索)

1)什么是GraphRAG?

GraphRAG =知识图谱+检索增强生成(RAG)。简单说:先用大模型把文本里的实体和关系抽出来,画成一张“知识图谱”,再基于这张图来检索和推理。微软提出的GraphRAG方案,就是把文本抽取、网络分析和LLM生成融合到一个端到端系统中【turn0search0】【turn0search1】。2)形象说明

    传统 RAG:你在图书馆里,只能按照“书名相似度”找几本书,自己翻。GraphRAG:图书管理员给每本书画了一张“人物—公司—事件—地点”的关系网,你问“OpenAI 的 CEO 投资了哪些能源公司?”它可以沿着“CEO 人物节点 → 投资关系 → 能源公司节点”这一条“链路”找出来。
对企业而言,GraphRAG的价值在于:
    复杂查询(多跳推理):比如“某供应商过去三年涉及的合同和诉讼情况”;跨部门/跨系统的知识关联:不同文档、不同业务线的知识能真正“串起来”。
三、名词解释:DoRA—— 更聪明的模型微调

1)什么是DoRA?

DoRA = Weight-Decomposed Low-Rank Adaptation(权重分解低秩适配)它是在LoRA(Low-Rank Adaptation)基础上的升级:
    LoRA:只训练少量“适配矩阵”,在不改原模型的情况下提升效果;DoRA:把每一层预训练权重 W 拆成“大小(magnitude)”和“方向(direction)”两部分,
用LoRA专门调整“方向”,让模型学得更细、更稳,推理时没有任何额外开销。2)形象说明

    原模型像一条“高速公路”,路线已经定好;LoRA 在上面修了一些“匝道”,可以小幅度改路线;DoRA 不光调整路线走向,还能精细控制“每段匝道的车速和宽度”——
这样既不改原路结构,又能让车跑得更顺畅、更省油。对企业价值:
    用更少的算力,把大模型“调”得更贴合企业自己的业务风格;推理时不增加任何计算量——训练更聪明,服务不更贵。
四、名词解释:联邦学习—— 数据不离开本地的协同训练

1)什么是联邦学习?

联邦学习(Federated Learning)是一种“把训练过程带到数据所在地”的机器学习方式:
    数据不需要上传到一个中心服务器;每个设备/节点在本地训练,只把“模型参数更新”发给中心聚合;中心再把更新后的模型发回给所有节点,如此循环。
2)形象说明

    传统集中式训练:所有学生每天把自己的作业本交到总部,老师集中批改;作业内容里有大量隐私细节,风险很大。联邦学习:老师只把“解题方法”的升级版发给学生,学生在本地自己做练习,只反馈“改进建议”,原始作业内容不离开教室。
在AI和企业场景中:
    适合银行、医疗等数据敏感行业:多家机构可以在不泄露原始数据的情况下,共同训练一个更聪明的风控模型或诊断模型对于数字游民/远程协作场景:可以用联邦学习在多台设备上协同训练个人助手,而不让所有数据集中到一个云端服务器。
五、小结:技术路径的选择

    GraphRAG:帮企业把“孤岛知识”连成“知识网络”,适合复杂问答与多跳推理;DoRA:用更低的训练成本,让通用模型“变成企业自己的说话方式”;联邦学习:在隐私合规的前提下,让多方共同训练更好的模型。
这三者共同构成了企业AI在“理解—适配—协作”三条路线上的重要工具。---一、SaaS的死结:为什么国外SaaS能跑起来?

在成熟市场,典型SaaS的逻辑是:
    我卖你的是“行业最佳实践”;你按我的流程使用,可以变得更高效、更合规;我统一维护、统一升级,你只要订阅。
核心假设:-流程标准化 → 产品化 → 规模化 → 持续订阅。二、中国市场的现实:包工头式“伪SaaS”

在中国,很多所谓的SaaS实际上是这样玩的:
    客户说:“我要按我自己的流程来,你得改”;厂商说:“行,给你做一套定制 + 模块化组合”;结果:项目一次性交付为主;很少有真正的“持续订阅 + 统一升级”;每一个中大型客户背后都是一支“驻场开发队”。
这本质上不是SaaS,而是“软件包工头”。后果:
    厂商永远在做新项目,很难形成可复用产品力;客户被深度绑定,但迁移成本又极高;新玩家很难用纯产品化方式切入。
三、MaaS的账算不过来

在AI这波浪潮中,看到:
    很多云厂商、模型公司打“价格战”:单价看似很低(比如几分钱/千 Token);但 Agent 调用链路一旦变长:多轮对话 + 上下文缓存 + 向量检索 + 多次工具调用,单次交互成本轻松达到“几毛甚至几块钱”;对于利润薄的中小企业,这笔“算力账”很难算得正。
更现实的情况:
    企业往往只知道“云账单变多了”,但不清楚:哪些 Agent 链路在“烧钱”;哪些调用其实可以换更便宜的小模型;哪些逻辑根本不需要上大模型。
MaaS若只内嵌在“本来就卖不好”的SaaS中,很容易变成:-“软件还没卖明白,又多了一个AI成本中心”。剖析了中国SaaS的"伪标准化"困局——客户要定制,厂商变包工头,最终导致产品化能力孱弱。但更残酷的现实是:当MaaS(模型即服务)试图嫁接在这套"非标底座"上时,成本账彻底算不清了。为什么?标准化SaaS:100个客户共用一套流程 →1次AI调优可复用100次 → 单客成本摊薄;定制化"伪SaaS":100个客户100套流程 → 每个客户都要单独调试Agent链路 → 单客成本×100。这直接引爆了"成本诅咒"的双重维度:Token数量诅咒:定制化流程导致Agent调用链路冗长(5轮对话+3次检索+2次工具调用);推理深度诅咒:为适配非标业务,Agent需反复"反思循环"修正输出,思考步数指数级增长。破局不能只靠"等模型降价",而要重构架构:用端侧SLM处理80%高频任务,云端大模型只攻坚20%复杂场景——这正是端云协同的商业本质。---一、成本诅咒:从Token数量到“思考时间”

过去只关心:-这一次调用“用了多少Token”;未来还要关心:-模型“思考了多少步”。比如OpenAI o1这类推理模型,已经开始尝试按“推理步数”计费:-模型思考10步,和思考100步,收费不同,甚至差一个数量级。这意味着:
    “深度思考”会变成一种奢侈品;普及型 AI 不会是“最聪明的 Agent”,而是“最够用的 Agent”。
二、分层访问:云端大脑+端侧小脑

更现实、更“算得过来账”的架构是分层:
    云端大脑:大参数模型,处理复杂推理;调用频率相对较低;端侧小脑:小模型(SLM),跑在本地 CPU / NPU 上;处理 80% 的日常任务:摘要、翻译、简单问答、文档分类;成本接近于零,且无网络依赖。
对比云游戏:
    云游戏失败是因为:所有渲染、逻辑都在云端,完全依赖网络,终端是“哑终端”;AI 端云协同中:本地 SLM 是“精明的守门人”,断网时也能降级服务(从“博士”降成“小学生”),这种“弱网络依赖”才是普及的关键。
三、SaaS的消亡与进化:真相层与意图层分离

当AI可以通过对话“现场生成”一个CRM或报表工具时,传统SaaS还有价值吗?我的观点:SaaS不会消失,而是会角色分化:1)技术维度

    Agent/LLM:擅长模糊、自然语言交互,但本质是概率性输出,偶尔会“幻觉”;SaaS 数据库:代表“确定性的事实”:1 就是 1,0 就是 0;要保证 ACID——原子性、一致性、隔离性、持久性。
如果让Agent直接“接管”数据库,一旦它“觉得”库存有100件(实际只有10件)并答应客户发货,整个供应链都会崩掉。2)商业维度

    SaaS 里沉淀了企业多年形成的“最佳实践”和“规则”:发货前必须校验信用额度;某类操作必须有二次确认;审批流程不能随意跳过;这些规则,本质上是企业的“宪法”;Agent 更像“律师”:帮你理解“意图”(比如“帮我批个假”),再去查“宪法”(SaaS 流程)看是否合规。
3)法律与审计维度

    每一行数据修改、每一次关键操作,都需要可追溯的日志;Agent 的“黑盒决策”很难向法院解释:是“模型故意”,还是“系统故障”?SaaS 充当了“证据固化者”的角色:所有对数据库的实际修改都要通过它;人类(或企业)点下“确认修改”的那一刻,才是法律生效的瞬间。
所以:
    SaaS 会退化为“真相层”:负责存储、规则、日志、审计;Agent 会变成“意图层”:负责自然语言交互、意图理解、执行建议;UI 不只是界面,而是“法律契约容器”:“确认删除”“确认打款”这类按钮,必须是厂商硬编码的,因为它们代表着法律责任与 SLA。
---一、从剩余价值到“算法剩余价值”

场景设想:一家公司从10个人裁到3个人,另外7个被AI替代:
    这 3 个人:购买最贵的 Copilot / 企业 AI 服务;业务量暴增 100 倍,API 调用频次增加 100 倍;对企业来说:薪资支出减少了;软件与算力支出增加了;总收益可能有所提高,但涨幅通常远低于 100 倍;对个人来说:剩下的人被绑在 AI 系统上,随时“补漏洞”,被替代的人成为“产业后备军”,压低整体议价能力。
这就是“算法剩余价值”:
    技术进步带来的超额收益,大多被资本和平台拿走;普通劳动者从“出卖体力”升级为“出卖神经与注意力”。
二、产业后备军的2.0版

在马克思那里,“产业后备军”是资本调节劳动力市场的工具:
    人太多 → 工资自然被压低;人太少 → 再把后备军拉回来。
在AI时代:
    那些被 AI 替代的人,不一定马上显性失业,而是变成各种形态的“数字零工”:兼职远程;平台接单;自由职业;看起来“更自由”,但整体议价能力被系统性削弱。
三、技术封建主义:云领主与数据农奴

“技术封建主义”这个概念,强调的是:
    传统的封建领主拥有“土地”;今天的云巨头拥有的是“算力平台”和“用户生态”:你在平台上创作、交易、社交;行为数据变成平台改进算法的养料;真正的利润大头归平台所有。
数字游民和内容创作者,某种程度上就是“数据农奴”:
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
您需要登录后才可以回帖 登录 | 注册 微信登录

本版积分规则

Archiver|手机版|AGB|Impressum|Datenschutzerklärung|萍聚社区-德国热线-德国实用信息网

GMT+1, 2026-2-23 06:57 , Processed in 0.069558 second(s), 27 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表