新闻 发表于 2025-10-27 17:47

AI数字播客制作教程

作者:微信文章
引言:

2025年AI发展迅猛,AI视频大模型百花齐放,各种创作形式推陈出新,我也在这样的风潮下自己尝试做了一期数字博客的中视频。

制作这一期内容,我一共分为四个部分:播客文案转换、AI声音生成、视频对口型生成、后期剪辑。下面,我将逐步介绍我这四个阶段的具体制作流程:
播客文案转换:(辅助工具:豆包|deepseek)


首先,我选了一篇我自己的原创文案,这篇文案其实是我自己针对凡人修仙传观后感的一个观点的表达。我将这篇文案先后喂给了豆包、deepseek,帮我生成对话式的播客内容。在测试中,豆包和deepseek为我生成的文案内容都较好的完成了我的要求。在经过几轮调试和对比之后,我得到了一篇自己还较为满意的文案脚本。
AI声音生成:(minimax)


这次用到的是海螺AI的minimax speech-2.5模型,我通过这个模型创建了两个属于我自己的音色。将之前文本中两位主播的口播内容进行了声音的转换。



注:在这一步我其实也踩了一些坑。就是如果只是作为音频输出的话,我是可以将整篇文章进行音频转换。但是如果我要在后期制作视频内容,就需要对音频内容进行切片。碍于现在视频生成的时长受限。我在后期只保留了我创建的音色。
视频对口型生成:(即梦)


对口型这一步其实我花了很长时间,因为一直在测评市面上一些对口型的大模型。比较了很多之后我最终还是选择了即梦的商业模型来处理视频对口型生成。因为视频生成的市场受限,所以我也在这个阶段花了很多时间来生成。


后期剪辑:


一切素材都准备好之后,就是在剪映里去剪辑和合成。这一步其实没花多少时间,主要就是片头和片尾加了一些logo动画,整体声音声量做了一个统一。
页: [1]
查看完整版本: AI数字播客制作教程