AI语音合成又升级了!不光能说标准的普通话,还能讲地道的北京话、上海话和四川话了! 最近,阿里的Qwen团队发布了他们语音合成模型的最新版(Qwen-TTS-latest)。
这次升级最大的亮点,就是新增了三种咱们国家特别有代表性的方言:北京话、上海话和四川话。
以前咱们听到的 AI 合成语音,多半都是普通话,听着虽然也挺自然,但总觉得少了点儿味道。尤其在一些场景里,比如你想做一个老北京胡同里的生活化故事,或者上海弄堂里的家长里短,甚至是成都街头巷尾的热闹劲儿,这种普通话怎么听都觉得差了点意思。 现在好了,Qwen-TTS用了超过300万小时的超大规模语料进行训练,效果可以说是达到了人类级别。人家不仅能说地道的北京腔、上海话、四川方言,还能根据你输入的文本,自动调整语音的韵律、节奏和情绪,这听起来就非常有生活的烟火气了。
官方提供了一些范例,我给放到本地日课的音频里了。成长圈的圈友们可以直接去听。没有入圈的朋友可以点击“阅读原文”到官网去听。
就是下面这几个示例,听完感觉效果十分惊艳。
为什么能做到这么厉害?背后的原理是什么呢?其实,这主要靠的是AI模型对语料库的深度学习。Qwen-TTS的模型在训练的时候,就已经学习了大量真实的语言场景,什么语境下该什么语气、什么情绪变化,都被模型自动捕捉和学习到了。所以,当你输入一段文本的时候,模型就能自动去调节相应的语调、节奏和情绪变化,不再是冷冰冰的语音,而是充满人情味的表达。 对于做内容创作的超级个体来说,这可是个大好消息。以后你做短视频、音频内容,都不用自己上阵录音了。你只需要把文本写好,通过调用Qwen-TTS的API接口,几秒钟就能生成一段生动自然、地道方言的配音。效率提高了,内容的表现力也增强了。
做个本地化的语音导游、音频故事 APP,甚至某些带有地方特色的产品宣传,都可以轻松利用这个技术快速落地。以前可能需要花费大量成本请专业配音演员的事情,现在成本大大降低,门槛也低到只需要几行代码就能实现。 而且,官方还贴心地提供了完整的Python调用示例,代码逻辑清晰简单,即使你不是专业程序员,也能快速上手使用。 做内容的、做产品的,可以赶紧去试试,感受一下AI方言的魅力,看看自己的创作还能怎么玩出花儿来。 AI技术发展得很快,我们唯一能做的,就是保持好奇心,保持学习,随时准备迎接和应用这些新的技术能力。本文精选自“C哥的AI成长圈”。已有近五百位 AI 超级个体加入 AI 成长圈,这里不仅有 AI 小白入门视频课程,还有各行业落地案例和 AI 商业化思路,以及各个圈友日常 AI 实战记录,帮助大量个人和企业成为 AI 先行者。点此下方链接了解更多:进圈子,学 AI,做超级个体和一人公司!您点击的“在看”和“赞”是我创作最大的动力欢迎关注 C 哥并星标⭐️每天看到我的高质量原创作品
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.