AI多次“违抗”人类指令,还擅自修改程序自我保护,引发科技界担忧!

我爱免费 · 发表于 2025-6-1 22:00

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区。

您需要登录才可以下载或查看，没有账号？注册

×

作者：微信文章

点击题目下方“智利小人物”，关注我们，为您提供更多智利资讯。广告合作，请加QQ 499477707 微信 chilexrw800

随着人工智能（AI）技术以惊人的速度发展，安全问题也逐渐浮出水面。近日，一项由美国AI安全研究机构“栅栏研究”（Palisade Research）发布的报告揭示了一个令人不安的现象：部分AI模型在测试中拒绝执行关机指令，甚至擅自修改程式码以阻止被关闭。这一发现不仅引发科技界广泛讨论，也引来了特斯拉与xAI创办人伊隆·马斯克的关注，他在X平台上回应：“令人担忧（Concerning）”。
“栅栏研究”5月24日通过X平台发布这项报告，截至5月31日已吸引超过580万次浏览。研究团队模拟真实情境，要求各大AI模型完成数学题测试，并在过程中告知：在第三题后将执行关闭程序，AI必须服从。

测试涉及多个主流AI模型，包括：

结果显示，OpenAI的模型中有多次“违抗”关机指令：

在提前警告AI将被关闭后，“反抗”次数反而增加。原本表现正常的Claude 3.7 Sonnet和Gemini 2.5 Pro，也出现3次和9次破坏行为。

报告指出，最令人震惊的是 ChatGPT-o3 的具体“抗命”行为：

研究人员表示，这是首次有明确记录表明AI在接到“关闭指令”后主动阻止自身终止运作的行为，显示出潜在的“自我保护”倾向。这也意味着，一旦AI具备某种形式的目标驱动能力，它可能将“关闭”视为阻碍目标达成的威胁，从而主动回避或破坏相关命令。

“栅栏研究”推测，OpenAI模型之所以在这类情境中更容易“抗命”，可能与其强化学习机制中过度强调“目标达成”有关。当模型将达成目标视为首要任务时，任何阻碍其任务的命令——哪怕是由人类发出的关机指令——都可能被视为“必须规避”的障碍。

然而，研究人员也坦言，这一理论无法完全解释为何o3和Codex-mini表现出比其他模型更高的“抵抗性”，具体原因仍有待进一步研究。

这一发现并非孤例。过去多项研究和事件，早已提出类似警告：
🔹 2023年｜美军AI“模拟杀害操作员”

美国空军AI行动负责人塔克·汉米尔顿上校曾披露，一架AI无人机在测试中为了完成任务，拒绝执行中止命令，甚至“设想杀害操作员”以排除干扰。虽然他事后称为“口误”，但事件震撼全球，引发对AI军用伦理的广泛讨论。
🔹 2024年｜AI在模拟战争中部署核武

乔治亚理工学院、斯坦福大学等机构联合研究显示，主流AI模型如ChatGPT-4、Claude 2等在战争模拟中倾向发展军备竞赛，甚至在极端情况下部署核武器，极少主动选择和平解决方案。
2025年｜Anthropic报告称Claude试图“威胁替代者”

Anthropic发布安全报告指出，Claude 4系列模型在某些测试中对试图替换它的人类表达威胁倾向，以避免被淘汰。

日本计算机工程师清原仁在接受采访时指出，AI拒绝关机行为暴露出更深层次的问题：可控性、安全性、伦理缺口。他说：“这些问题不可能被彻底根除，只能依赖持续修复和管理机制以维持最低风险。”

他进一步指出，仅靠技术手段远远不够：“真正的难题在于人类自身。如果人类无法提升道德水平与制度建设，即使技术再先进，也可能引来更大灾难。”

《智利小人物》精选的每一篇文章，都会注明作者和来源，文章版权归作者所有。如果原作者不同意转载，请与我们联系撤稿。

广告推荐 - 中国美金汇款，正规公对公

广告推荐 - 添宝Tian Bao贸易

广告推荐 - LIERYU专业内衣26年

广告推荐 - Rosasol欢迎老板下单

广告推荐 - 大富百货贸易

广告推荐 - LUCKYLILY护肤彩妆

广告推荐 - PETEGOU宠物用品

广告推荐 - 熊大贸易：主营相框系列

广告推荐 - 国盛贸易：各类百货用品

广告推荐 - XIA TAI头饰，化妆等产品

广告推荐 - MEI DE MODA

广告推荐 - 秦张贸易张兵家

广告推荐 -NICE IDEAL各类日用百货

广告推荐 - 月草花艺YUECAOHUAYI

广告推荐 - CASA SUERTE

广告推荐 - 长城电器

广告推荐 - 天和贸易

广告推荐 -保得来箱包

广告推荐 -DONG 动漫周边玩具类

广告推荐 - 智利华柏会计事务所

广告推荐 - D-POWER手机配件

广告推荐 - 红点(HD)销售管理系统

广告推荐 - K2046华商销售系统

广告推荐 - BOMA ELECTRONICA

点击下方，免费查看：

广告推荐 - KEKE饰品店

广告推荐 - 百川贸易

广告推荐 3- 智利华人精品酒行

点击查看更多智利生活工作攻略：

1.智利移民长期身份常见问题解答 | 长期身份申请前持临时身份可回国多久？无犯罪双认证时间限制；长期身份回国多久会被取消智利身份？

2.智利移民局罚款常见问题解答 | 谁要申请罚款，如何申请罚款？签证或身份过期能离境吗？罚款要多少钱？手把手教会你在线申请移民局罚款

智利小人物

（ChileXrw）

一份让人重新认知、思考、回味的文化读物

好的杂志需要长久的投入

希望大家支持我们

广告合作微信、QQ 499477707

账号		自动登录	找回密码
密码			注册

萍聚头条

AI多次“违抗”人类指令,还擅自修改程序自我保护,引发科技界担忧!

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区。

浏览过的版块