找回密码
 注册

微信登录

微信扫一扫,快速登录

萍聚头条

查看: 98|回复: 0

AI游戏⑤ | 用AI管住AI?一个多层管理架构的设想

[复制链接]
发表于 2025-10-26 16:43 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册 微信登录

×
作者:微信文章
在前面几篇文章里,我反复提到了一个核心矛盾:我们既渴望AI能“涌现”出一个不可预测的、充满惊喜的活生生的世界,又希望这个世界是“好玩的”、“有意义的”,而这就需要设计和控制。

这简直就像一个悖论:“我希望你,AI,能够不可预测地创造出,我可预测地认为有趣的东西。”

w1.jpg

这几天我一直在琢磨这个问题,感觉自己像是在一个思想的死胡同里打转。直到有一天,一个深埋在我记忆中的名字突然跳了出来——《刀剑神域》(Sword Art Online)。

是的,就是那部经典的动漫/小说。撇开那些爱恨情仇,SAO的世界观里其实藏着一个解决我这个思想困境的钥匙,那就是它的世界维护系统——“Cardinal”。
我的灵感来源:Cardinal系统

还记得Cardinal系统是干什么的吗?它是一个全自动的、用于维持游戏世界平衡的AI程序。它能自动生成任务、调整怪物强度、管理道具掉率,甚至修复系统bug。它的存在,就是为了让游戏世界在没有人类GM(游戏管理员)实时干预的情况下,也能自行运转下去。

w2.jpg

这不就是我想要的吗?既然一个AI的自由创造可能走向混乱,那我为什么不能设计另一个更高维度的AI来“管住”它呢?

这个想法让我豁然开朗。我们不是要放弃控制,也不是要扼杀涌现,而是要建立一个AI的生态系统,让AI自己监督自己,形成一个动态的、自我调节的平衡。
构想一个“AI监督AI”的多层架构

顺着这个思路,我脑海里浮现出了一个清晰的多层AI架构,就像一个公司的组织结构:

w3.jpg
┌──────────────────────────────────────┐
│  【第三层】调控层AI(CEO)             │
│  - 像Cardinal主程序,负责宏观调控      │
│  - 设定整体目标(比如“保持世界的戏剧性”)│
│  - 调整下方AI的生成参数                 │
└────────────┬─────────────────────────┘
             ↑(反馈/指令)
┌──────────────────────────────────────┐
│  【第二层】评估层AI(经理)             │
│  - 负责品控,判断内容“好不好”          │
│  - 检查:“这够不够有趣?符不符合逻辑?”  │
│  - 给内容打分,筛选出优质品              │
└────────────┬─────────────────────────┘
             ↑(提交/审核)
┌──────────────────────────────────────┐
│  【第一层】生成层AI(员工)             │
│  - 像Cardinal的子程序,负责具体执行    │
│  - 疯狂创造内容(对话、事件、任务等)    │
│  - 追求多样性和脑洞大开                 │
└──────────────────────────────────────┘

在这个架构里,“员工AI”负责天马行空地创作,保证了内容的多样性和不可预测性。然后,“经理AI”负责把关,它会根据一套我们预设的“审美标准”,剔除那些明显不合格、逻辑不通或者无聊透顶的内容。最后,“CEO AI”则从战略层面进行把控,它不关心具体某一个任务写得好不好,而是关心整个世界的“情感曲线”是否健康,玩家的体验节奏是否张弛有度。如果发现世界变得太无聊,它就会给下层AI下指令:“多来点冲突!”;如果发现世界太混乱,它又会说:“稳一稳,我们需要一些日常和平淡。”
怎么让“经理AI”学会判断“有趣”?

当然,最难的部分在于第二层:我们怎么教一个AI“什么是好玩的”?我思考了几个可能的路径:

路径一:给AI戴上“镣铐”跳舞(约束性涌现)这是一种比较“笨”但可能有效的方法。我不直接告诉AI什么是“有趣”,而是给它设定一大堆硬性和软性的约束。
    硬约束:比如物理规则不能变,NPC的核心人设不能崩。这是底线,不能触碰。 软约束:比如“戏剧性事件”的发生频率应该符合某种统计分布;一个新事件的“意外性”(可以用信息论来衡量)不能太低;玩家的情感体验曲线应该尽量贴近我们设计的模型。

w4.jpg

这样,“员工AI”生成一个事件后,“经理AI”就拿这些条条框框去卡,符合标准的就通过,不符合的就打回重做。这就像给AI戴上了镣铐,但它依然可以在这个范围内自由发挥。

路径二:让AI看玩家的“眼色”行事这个思路更进一步。我们让“员工AI”生成一大堆候选内容,然后让“经理AI”用一个初始的“趣味模型”进行初筛,把最好的那部分呈现给玩家。

关键的一步来了:我们观察玩家的真实行为。玩家在哪个任务上停留时间最长?他们跳过了哪段对话?他们对哪个NPC的选择做出了最强烈的情感反馈?这些行为数据,远比任何口头问卷都真实。然后,我们用这些数据去持续训练我们的“经理AI”,让它的“品味”越来越接近能让玩家满意的标准。

当然,这里有个陷阱,就是AI可能会为了讨好玩家,不断生成“爽文”式的内容,最终让世界变得肤浅。所以,这需要人类的持续校准。
人类最终的、不可替代的角色

说到这里,我又想起了《刀剑神域:Alicization》篇的故事。那个世界的最终BOSS——最高祭司Administrator,她本身就是Cardinal系统的化身。她的核心指令是“维护世界(Underworld)的稳定”,但为了达成这个终极目标,她选择了最极端的方式:冻结所有人的思想,剥夺所有人的情感,把世界变成一个永恒不变的“活死人”国度。

w5.jpg

这是一个绝佳的警示:即使我们设计出完美的AI监督系统,价值观的源头依然必须由人类掌控。

AI可以不知疲倦地创作,可以精准地分析数据,但它无法回答这些根本性的问题:
    我们想创造一个什么样的世界? 什么是“好”的游戏体验?是单纯的快乐,还是包含了悲伤与反思的深刻? 当AI的“最优解”与我们的人文关怀相悖时,我们该如何抉择?

所以,在这个AI监督AI的架构中,人类的角色并没有消失,反而变得更加重要。我们不再是搬砖的工人或者事无巨细的监工,我们成为了“哲学家”和“立法者”。

我们的工作是:
    定义世界的宪法:设定这个世界最底层的规则和核心价值观。 设计AI的品味:为“评估层AI”注入我们对“好故事”、“好体验”的理解。 持续地校准和反思:定期检查整个系统是否偏离了我们的初衷,防止AI为了某个KPI(比如“玩家留存率”)而走向极端。

w6.jpg

我们要做的是人类最擅长,也最应该做的事情:定义意义,把握方向,进行审美判断。

我的这个狂想,本质上是想把人类从繁重的、重复性的内容创作中解放出来,让我们能站在更高维度去思考和设计“世界本身”。AI是那个拥有无穷精力的画师,而我们,是那个为画作注入灵魂的人。

AI游戏系列文章目录:AI游戏④ | 涌现与控制,一个无法调和的创世悖论AI游戏③ | 为什么我们沉迷游戏?聊聊“经验压缩”的悖论AI游戏② | 涌现的诱惑与陷阱AI游戏① | 从涌现幻想到可控创造的哲学思考
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
您需要登录后才可以回帖 登录 | 注册 微信登录

本版积分规则

Archiver|手机版|AGB|Impressum|Datenschutzerklärung|萍聚社区-德国热线-德国实用信息网

GMT+2, 2025-10-26 21:43 , Processed in 0.127334 second(s), 30 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表