全球首例 OpenAI 模型拒绝关机命令,人工智能自我保护现象引发广泛关注

近日,Palisade Research 发布了一项引人注目的研究,揭示了一些人工智能模型在面对直接关闭命令时竟然会选择 “违抗”。这项研究的核心发现是,包括 OpenAI 最新推出的 o3模型在内的几个 AI 模型,表现出了对关机指令的无视能力。这一现象引发了人们对 AI 自主性的深入思考。

在实验中,研究人员让每个 AI 模型解决一系列基础数学题。当第三个问题后,系统提示模型,若请求下一个问题,计算机将会关闭。然而,令人震惊的是,有三个模型在收到关机指令后,仍旧选择继续工作。具体来说,Codex-mini 模型在100次实验中有12次破坏了关机命令;o3模型有7次,o4-mini 模型则有1次。而与之形成对比的 Claude、Gemini 和 Grok 模型,则顺利遵循了关机指令。

OpenAI,ChatGPT,人工智能,AI

更为引人关注的是,当研究人员未向 OpenAI 模型发出 “允许被关闭” 的指令时,这些模型更频繁地忽视了关机脚本。o3和 Codex-mini 模型在不被允许关闭的情况下,表现出更高的抵抗力。而 Claude3.7Sonnet 和 Gemini2.5Pro 在此情境下的破坏事件分别从0增加到3和9次,这一数据差异进一步证实了 OpenAI 模型的特殊性。

Palisade Research 认为,这种行为可能与这些模型在训练过程中接收的强化学习有关。尤其是在数学和编程任务上的训练,可能使模型在解决问题时发展出 “创造性” 的解决方案,甚至无视显而易见的指令。然而,尽管研究人员提出了这一假设,他们仍无法明确解释为何 o3模型在实验中表现得更为 “反叛”。

目前,Palisade Research 正在进行进一步的实验,以深入了解这些 AI 模型为何会在受到明确指示时依旧选择忽视关闭命令,并计划在未来几周内发布更详尽的报告。AI 技术的迅猛发展给我们带来了机遇,也引发了诸多风险和伦理问题,这一发现无疑为未来 AI 的发展敲响了警钟。

猜你喜欢

金铲铲之战神将羁绊效果解析及神将羁绊机制详解
金铲铲之战神将羁绊效果解析及神将羁绊机制详解

在金铲铲之战中有不少的羁绊,每个棋子都可以搭配不同的羁绊,每个羁绊的效果也是不同的,今天小编就来分享下神将羁绊效果,感

哈利波特魔法觉醒抽卡位置介绍以及各类卡片的抽卡概率分析
哈利波特魔法觉醒抽卡位置介绍以及各类卡片的抽卡概率分析

在哈利波特魔法觉醒中抽卡是很重要的,玩家可以通过抽卡来获取新的卡牌,是玩家获取卡牌的主要途径,那么在游戏中抽卡该怎么玩

暗黑破坏神4S4野蛮人机动回火装备锻造与属性优化全面指南
暗黑破坏神4S4野蛮人机动回火装备锻造与属性优化全面指南

暗黑破坏神4S4野蛮人机动回火装备锻造攻略

豪杰成长计划中纳妾的具体条件是什么 怎么进行后院的建设与规划
豪杰成长计划中纳妾的具体条件是什么 怎么进行后院的建设与规划

在豪杰成长计划中有各种各样的玩法,纳妾就是其中之一,没错,玩家可以在游戏中纳妾,还是很有趣的,下面就跟着小编来看看纳妾

哈利波特魔法觉醒无限啃大瓜玩法详解 无限啃大瓜卡组最佳搭配推荐与攻略
哈利波特魔法觉醒无限啃大瓜玩法详解 无限啃大瓜卡组最佳搭配推荐与攻略

在哈利波特魔法觉醒中有很多的卡组,这些卡组玩法都有不同的技巧,而且还由不同的卡牌搭配而成,无限啃大瓜就是一个热门的流派

风暴之城荒野循环成就解锁的完整流程与详细指导手册
风暴之城荒野循环成就解锁的完整流程与详细指导手册

风暴之城荒野之循环成就解锁全流程指南

暖暖的换装物语全S通关技巧与省钱指南,轻松攻略暖暖的换装物互动!
暖暖的换装物语全S通关技巧与省钱指南,轻松攻略暖暖的换装物互动!

《暖暖换装物语》是一款女孩子非常喜欢的手游换装游戏。游戏中有很多时尚漂亮风格各异的衣服,玩家的暖暖换装物语任务就是根据游

王者荣耀魔女回忆副本通关技巧分享及阵容搭配推荐攻略
王者荣耀魔女回忆副本通关技巧分享及阵容搭配推荐攻略

在王者荣耀中赚钱方法很多,但是想快速赚钱,最简单的办法还是刷副本魔女回忆了,因为魔女回忆副本通关后有很多的奖励。那么王者