找回密码
 注册

Sign in with Twitter

It's what's happening?

微信登录

微信扫一扫,快速登录

查看: 273|回复: 0

AI解放双手的伟大实践

[复制链接]
发表于 2026-1-28 19:37 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册 微信登录

×
作者:微信文章
前阵子和一个朋友在微信上聊天,聊马斯克的话题,两个人聊得很起劲。

我自认为自己是一个无论电脑打字还是手机打字都特别快的人,但我发现我这个朋友简直像挺机关枪一样,大段大段的内容输出得飞快,我这头还在打字呢,她那边一整屏的文字又发过来了。

有那么一刹那,我怀疑她是不是接入了一个agent(智能体)在和我对话,我甚至直接和她提出了这样的疑问:你是训练了一个agent自动回复吗?怎么回复得这么多这么快啊,哈哈。

然后她告诉我,她用的是豆包的语音输入法。她说她不喜欢打字,现在基本上都只用语音输入来完成打字了,有时候甚至会和豆包聊上10分钟、20分钟,豆包也会耐心记录下来。

当时我没有被她说动,还是坚持着“古法手打”的做派。但后来,在不同的几个群里,都看到有朋友提到,他们最近都开始用语音输入法,并且他们的感受都是用得特别爽。

除了豆包,还有好几个朋友推荐了一个叫做Typeless的输入法,这个输入法的功能和豆包类似,不过只能在桌面端用(而豆包只能在手机端用)。它和豆包的不同之处在于,豆包会更加忠实地记录用户所说的内容,而Typeless则会多做一些修改,来完善表达。

我能非常直观地感受到,这些用上了语音输入法的朋友表达和输出的能力显著增强了,并且时不时地能飙上一大段想法,就像是“机械飞升”了一样,在表达效率上快得和其他人不是一个物种了。

这下真让我有点心动了。昨天我试了试豆包、搜狗的语音输入法,后来发现微信也上线了这个功能。

不过在微信里使用,需要点击聊天框里的话筒符号,而不是原来的“按住说话”再转文字的功能,两者有明显差别。

微信自带的AI语音输入法

而且似乎这个功能还在灰度测试中,因为我发现身旁的其他一些朋友没有这个功能,而我是在安装了豆包输入法之后,突然发现微信出现了这个功能,可能是一种防御性的行为。

在体验之后,我发现通过语音输出文字的爽感比我想象得还要更强!

原来微信上也有语音转文字,和现在的语音输入有什么差别?

我自己体验下来,区别还是挺大的。以前的模式我们可以把它叫做传统语音输入法,最近的这个可以叫AI语音输入法。

第一个感觉是特别丝滑。可以实时地将文字展现出来,而不是原来那种存在明显迟滞感的体验。你说话的时候,文字几乎同步出现在屏幕上,这种即时反馈带来的流畅感,让整个输入过程变得像说话一样自然。

第二个是准确率大幅度提高了。传统的语音识别,我以前觉得最大的痛点是,识别准确率虽然还不错,但最后还是得好好看一遍,有一些内容需要自己编辑,特别是说到一些专业词汇的时候没法转化好。但现在的AI语音输入法,对专业术语、人名地名的识别准确度惊人,基本上一次性就能准确输出。

第三个是语言支持变得更丰富了。传统模式下一定得用相对标准的普通话,但现在连一些方言也能识别,中英文夹杂着讲也没问题。我有个广东的朋友,用粤普讲话也能准确识别,这在以前是不可想象的。

第四点,也是最让我惊喜的——现在的AI语音输入法真的“更聪明”了。它可以过滤掉一些多余的口头禅,比如“这个”“那个”“嗯”“啊”之类的语气词,还可以根据语境梳理语义,输出更规范的文本。有时候你说话逻辑稍微乱一点,它也能帮你理顺,甚至自动加上合适的标点符号。

第五个点在于时长不再受限。以往可能讲到一分钟就得停下来,但现在完全是随心所欲,想讲多久就讲多久。我有次试着连续说了好久,它依然稳定地记录着每一个字。

有了这样的工具,我觉得对人类带来了进一步的解放,很多事情变得更方便,效率大幅提升。

以前用手打字,有时候总是会纠结。每打一个字之前,总是倾向于让这个字变得很完美,反复斟酌用词。但讲的时候,你就有勇气把话说出来,思维是流动的,不会被“完美主义”卡住。在这个基础上,你可以先有个基础稿,然后再去改,AI也可以帮你调整得更加合适。

走出第一步永远比纠结要来得重要。而语音输入转文字能做好的话,确实能够大幅提升大家想法落地的可能性。

就比如说我自己写文章写公众号的时候,以前总是先想很多,把整个框架构思好,想好想要的语句再写下来。但有时候会陷入过度构思的陷阱,花很多时间打磨开头,反而迟迟没有实质进展,甚至把很多灵感都错过了。

但用语音的话,我就可以快速把脑子里的想法倾泻出来,先有一个完整的草稿,再去打磨。这种“先完成,再完美”的创作方式,让我的产出效率至少提升了两三倍。

就比如你现在正在看的这篇文章,它的基础框架就是我花了大概十五分钟,我负责口述,微信语音输入法给实时“写”出来的。

更重要的是,语音输入改变了我和文字的关系。以前打字是一种“制作”文字的过程,现在更像是“捕捉”思维的过程。那些稍纵即逝的灵感、转瞬即逝的想法,都能被及时记录下来。

……

现在正是互联网巨头争夺AI流量的关键时刻,大家都希望能够打造属于自己的AI时代的Super App。

字节直接把自己的输入法命名为“豆包输入法”,和自己的大模型产品“豆包”命名一致,显然是带有这样的意图:让键盘以及语音输入这一最为高频的工具,成为用户了解和习惯“豆包”品牌的重要一环,并通过这个输入法不断展现字节的AI能力,让用户潜移默化地习惯由字节的大模型所带来的优秀AI体验,在抢占用户心智的同时,进一步引导用户到自己的平台之上,扩大自身的市场份额。

微信作为一款国民级社交软件以及腾讯应用和展现AI能力的重要平台,而且又是用户每天大量文字内容输出和沉淀的平台,肯定不希望自己的竞争对手通过外挂的AI输入法侵入自己的领地。

腾讯在2021年完成了对搜狗的收购,将市场份额最高的输入法纳入了自己的麾下,而如今,豆包输入法显然正在发起一场强有力的挑战。腾讯要用什么样的方法来进行应对,值得我们期待。

……

有个朋友在用过语音输入转文字的功能之后,发出了这样的感慨:

“人类的进化已经开始了。现在可能不需要在生理上有很大改变,只需要在工具使用上产生差别,就能成为两种不同的物种。那些能把各种AI工具用好的人,在我眼里已经是一个更高维的物种了。”

我深以为然。

我们讲达尔文的进化论,物种会在适应环境的情况下,进行各式各样的变化。但人类的优势在于,我们可以通过科技创新为自己带来新功能,而不需要等待漫长的基因突变。过往需要通过DNA变化、经过千万年才能拥有的能力,现在我们通过工具就能立即获得。这就是人类的伟大之处。

语音输入法看起来只是一个小小的工具,但它带来的改变是深层次的。它让那些思维敏捷但打字慢的人,不再被输入速度限制;它让那些有表达欲但害怕写作的人,能够更轻松地分享想法;它让创作的门槛大大降低,让更多人有机会成为内容创作者。

当然了,语音输入还是有一定缺点的,一个是费嗓子(利好金嗓子喉宝),另外在公共场合使用也不太方便,毕竟不是所有场景都适合对着手机自言自语。

但瑕不掩瑜。我想,再过几年回头看,我们可能会把AI语音输入法的普及,看作是人机交互史上的一个重要节点。它标志着我们从“用手指告诉机器”进化到了“用语言告诉机器”,从机器适应人,变成了人更自然地使用机器。

而再下一步,当脑机接口进一步发展之后,在那种情况下,我们甚至不用说话,机器就能了解我们的意图,直接开始工作,结合现在在vibe coding和agentic领域的各种进展,未来人类的工作效率还有可能以数倍甚至数十倍的效率提升。

这场解放双手的伟大实践,才刚刚开始。
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
您需要登录后才可以回帖 登录 | 注册 微信登录

本版积分规则

Archiver|手机版|AGB|Impressum|Datenschutzerklärung|萍聚社区-德国热线-德国实用信息网

GMT+1, 2026-2-23 06:56 , Processed in 0.069101 second(s), 27 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表