找回密码
 注册

Sign in with Twitter

It's what's happening?

微信登录

微信扫一扫,快速登录

萍聚头条

查看: 148|回复: 0

AI 手机的真相 - "点击屏幕"不是未来

[复制链接]
发表于 2025-12-13 21:17 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册 微信登录

×
作者:微信文章

w1.jpg
开篇:一个看起来很聪明的方案




豆包手机 和 开源AutoGLM 最近很火。能自动打开APP、查询信息、点击按钮、填写表单——看起来很酷。

有没有想过这样一个问题:为什么我们需要让AI去理解屏幕、点击按钮?





w2.jpg
第一部分:现在的"智能执行"其实是个死胡同




表面上看:模型智能化了,可以操作手机了。

本质上呢?这是一种信息的严重降维。

模型能处理的信息维度和复杂度,远远超过任何UI界面能呈现的内容。但我们却让它去识别像素、点击图标、等待页面加载——就像让一个超级计算机去做算盘的工作。
为什么会这样?

因为现在的APP是基于人类认知能力设计的。

    微信需要按钮,因为人眼需要视觉反馈


    淘宝要分类导航,因为人的短期记忆有限


    飞书需要清晰的菜单,因为人需要时间理解逻辑


但AI不需要这些。AI需要的是结构化的、完整的、高保真的信息——就像数据库表、API接口那样。

所以现在的状态就像:我们有了GPS卫星,却还在问路人要方向。
更扎心的问题

用图像识别去"破解"APP,用自动化去绕过现有系统——这本质上是技术对抗,而不是优雅的解决方案。

而且问题还不止这些:
    安全性:绕过APP的安全机制去读取金融数据,这在监管眼里是什么?脆弱性:APP一改UI,整个系统就崩了低效性:每一步操作都要等待,每一个识别都要耗时





w3.jpg
第二部分:被忽视的根本症结——应用中心化的诅咒




为什么我们被APP绑架了?




    要联系朋友?    打开微信、QQ要买东西?       打开淘宝、京东要开会记录?    打开飞书、钉钉要查快递?       打开菜鸟、顺丰

这看起来理所当然,但用第一性原理拆解就会发现——这其实很荒唐。
沟通的本质不是"微信",而是信息交换。

购物的本质不是"打开某个APP",而是消费者和生产者的连接。

中间"是微信还是QQ""是淘宝还是京东"——这些只是不同形态的"管道"而已,物理意义上没有本质区别。

但我们却被绑定在这些管道里,就像被这个时代的"应用中心化"的诅咒所困。
为什么会形成这个格局?




因为这是流量争夺时代的遗产。

在互联网上半场,流量就是生命。所以大厂争相打造闭环生态:
    用户进来了就别让他出去能自己提供的服务就绝不调用别人的把所有功能都塞进自己的APP

这个逻辑在当时是对的,但时代在变。


w4.jpg
第三部分:AI时代的范式转变




未来不是一个超级厂商把所有主流APP功能"重做一遍",形成内部生态闭环,因为这只是把"应用中心化"改成了"平台中心化",本质没变,只是换了个中心。

未来整个互联网架构应该是:
    所有服务都"API化"所有能力都"组件化"所有终端不再"以APP为单位"由AI作为统一入口和统一调度者


现在:
我打开微信 → 我找到张三 → 我发消息
我打开淘宝 → 我搜索商品 → 我下单支付
我打开飞书 → 我找会议记录 → 我整理笔记

未来:
我说:"帮我联系张三"
我说:"我要买一台两天内能送到的咖啡机"
我说:"帮我总结今天的会议并发给团队"

然后,一切都自动发生了。

    用谁家的通讯协议?AI决定。


    调用哪个平台的商品接口?AI决定。


    走哪条支付通道?AI决定。


    数据存在哪里?AI决定。


    权限怎么校验?AI决定。


这时候,微信不再是"微信",淘宝不再是"淘宝"。

它们只有一种身份:能力提供方(Service Provider)

而真正的"操作系统",不再是iOS,不再是Android——而是AI本身。
对用户的解放:你不用再记"这个功能在哪个APP里",你不用再重复登录、重复认证、重复输入。你甚至不用关心后台是谁在提供服务。

你只需要做一件事:表达你的意图。剩下的所有技术细节,都由AI完成。
对开发者的解放:现在的开发者被APP的框架锁死了。想创新?要符合APP的设计规范。想跨界?要跟各大平台谈合作。

未来开发者只需要,把能力设计成API、把组件标准化、剩下交给AI来调度组合,创新的门槛大幅降低,创新的可能性大幅提升。
对生态的激活:现在的生态是中心化的、竞争性的、零和博弈,未来的生态是去中心化的、协作性的、共生关系。这样,每个参与者都有动力把自己的能力做到极致。




智能执行的真实意义

所以在我看来,智能执行不是"未来",也不完全是"噱头"。

它是一个过渡产物,一个信号。

它的真实意义不在于"能点击按钮",而在于——它标志着当前架构已经开始松动。

当用图像识别去操作APP成为必需品时,说明什么?说明现有的架构已经不适应新的需求了。



尾声:我们需要做什么



如果你是用户,现在不用慌。继续用你的微信和淘宝,这个过渡会持续好几年。

但要意识到:你对手机的理解方式正在发生代际转变。

作为开发者或创业者,现在要思考的是:
    你的核心竞争力是什么?当世界API化时,你的能力还有价值吗?你能否从"应用构建者"转变为"能力提供者"?

最后一句话


"不是'我打开了什么APP',而是'我跟手机说了一句话,它帮我把事办好了'。"

那一天可能比我们想象中来得更快。
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
您需要登录后才可以回帖 登录 | 注册 微信登录

本版积分规则

Archiver|手机版|AGB|Impressum|Datenschutzerklärung|萍聚社区-德国热线-德国实用信息网

GMT+1, 2025-12-16 20:13 , Processed in 0.087107 second(s), 30 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表