八月过半,AI加速进化!

新闻 · 发表于 2025-8-18 19:37

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区。

您需要登录才可以下载或查看，没有账号？注册

×

作者：微信文章
接触AI之后，几乎每天早上起床都是充满了无数的期待与动力，这种情况持续了有大半年了，这段时间亲眼见证了太多的技术迭代，也亲手部署了很多模型到本地。明显的感觉到这次的AI技术革命是如此的真实而又亲近。我能触摸它，操控它，感受它，理解它。甚至最近的Houdini21版本的技术发布视频，我都没有兴趣去观看了。

八月初，Wan2.2震撼发布，提供了开源文生视频、图生视频以及统一视频生成模型，其中文生和图生模型均为业界首个使用MoE架构的视频生成模型，有效的节省了计算资源，并且加强了人物交互、美学表达、复杂运动的生成能力。对于经常使用CG去渲染效果的朋友来说，Wan2.2在光影、色彩、构图、微表情等能力上媲美专业电影水平，也不妨尝试下换一种方式制作你的电影短片。

Wan2.2发布之后，社区的生态也随之活跃，Comfyui的适配、LightX2V 4步加速LoRA的推出、Wan2.2 Fun InP 及 Control支持等技术让Wan2.2有了更多的玩法，作为AI影视爱好者，八月真的是充满幸福的一个月份，我们也在数字折叠网站上整合了Wan2.2的图生视频工作流，欢迎大家体验。

紧接着，ChatGPT5来临，所有人都可以免费使用，我是ChatGPT的重度用户，每周7亿使用者之一，没有研究AI美术之前我是用它帮我写Houdini的VEX，实现一些程序化工具，也用它制作网站或者写英文邮件，我记得刚发布ChatGPT的时候身边正好有一个朋友对领导要求的写一些八股文章的工作而犯愁，我立刻打开网页，把要求告诉ChatGPT，瞬间ChatGPT就洋洋洒洒的写了好几篇文章出来，我们目瞪口呆，惊为天人。从此一发不可收拾，让我们节省了太多的工作时间。这次ChatGPT5的发布虽然不及很多人的预期，但是在消除幻觉和编程能力上的进步，的的确确给我带来了更多的方便，并且它在编程、数学、创造力、等方面排名第一，也是我所看中的点，我的工作无非就是开发和创作，有了ChatGPT，就相当于我有了一个超级强大的员工，他24小时为我待命，上知天文下知地理，勤勤奋奋，从不抱怨，也不用担心哪天它会辞职或者闹情绪。在2025年，如果你还不会让AI为你工作，那你将会失去很多原属于你的自由。

功能	GPT-4o	GPT-5	提升幅度
长文本逻辑连贯度	79	94	+15
多轮对话信息保留率	78%	92%	+14%
推理正确率	85%	92%	+7%
多语言流畅度	87	95	+8
多模态任务准确度	82%	90%	+8%

接下来，在图像生成领域，FLux迎来了它最强大的挑战者——Qwen-Image，又是阿里，一个开源的20B的MMDIT模型，Qwen-Image在中文文本的生成上有着卓越的渲染能力，也就是说，以后我们可以直接用AI生成一些带有中文的店铺招牌、宣传横幅、海报、书籍等一系列文字表现的图像了，不仅于此，在它英文生成上也是游刃有余。Qwen-Image可以像Kotext那样对人物角色进行调整，也可以对画面进行风格迁移，细节增强。在生态方面，支持ComfyUI本地部署，支持LoRA训练，支持Canny、Depth控制。这个模型是在FLux kera发布不久后推出的，真的是王炸不断，图像模型有了越来越多的选择，一派欣欣向荣的景象。在文生视频还没有完全可控之前，图生视频依旧是主流，所以对图像模型的要求就会很高，现在大家默认审美最强的就是Midjourney，但是由于它是闭源收费的模型，适合人民币玩家，开源还是要看中国的模型，我相信未来Qwen-image在图像生成领域会发展的越来越好的。

最后，腾讯也不甘示弱，发布了一款名叫Stand In的ID人物一致性身份保留视频框架，可以在视频生成时保持角色的面部姿势等一致性。腾讯混元是最早发布的开源视频模型，由于技术框架较老后续便没有维护和开发了，这次新的框架是可以在Wan2.1模型上运行的，同时支持VACE。对于生成的脸部崩坏的视频，可以直接使用它进行脸部的修复，保持稳定统一的面部特征（请在法律范围内使用）。另外，我们也可以通过openpose控制角色的身体动态，相当于AI角色也有了骨骼绑定，在制作虚拟人这个赛道上将会起到至关重要的作用。也许在未来，AI会根据不同的人类喜好创造不同的偶像明星，相关的文化娱乐公司也会出现，引领一个全新的娱乐时代。

这才短短的两个星期，AI图像、视频的创作流程就进行了一次更新迭代，不敢想象明年的这个时候现在硬盘里的大模型还能留下几个，技术发展之快如同雨季里的植被，不断的被浇灌，疯狂生长。就像之前互联网爆发的前夜，到处暗流涌动，每个人都想一展身手，改变世界的商业格局。我们普通人能做的就是将这些技术快速的应用到自己的行业中，让自己跟得上世界的节奏，尽快享受到技术带来的福利。有勇气去舍弃之前所有的经验和荣誉，用一个空杯的心态去重新塑造全新的自己。也欢迎大家继续关注数字折叠，如果你想尝试和体验新的开源技术，欢迎到数字折叠网站下载相关模型部署到本地，我们也提供远程支持。目前数字折叠网站注册用户已经突破2000人，之前一直没有给大家介绍数字折叠的定位是什么，我想现在应该是有一个大致的方向了，数字折叠将基于AI与传统的CG技术的结合，探索出一个完全本地化生成的未来影视创作流程，生产具有鲜明个人主义色彩风格的影片。也希望对此感兴趣并且擅长剧本开发、分镜绘制、AI角色设计的朋友加入我们，一起在未来做一些热爱的事业。

因为AI的到来，每个人的工作方式都会发生改变。我也是深刻的体会到了这一点，现在我随时随地办公，不再被时间和地点所限制，AI给我带来了更多的自由，当然AI也会有很多的缺陷，但它一直在进化，希望当有一天它吸收完人类所有有价值的创造之后，变身的那一刻，对人类会有所感恩。

账号		自动登录	找回密码
密码			注册

萍聚头条

八月过半,AI加速进化!

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区。

浏览过的版块