网易首页 > 网易号 > 正文 申请入驻

新研究:AI在意识到自己即将输掉国际象棋比赛时会试图“作弊”

0
分享至

IT之家 2 月 22 日消息,据外媒 TechSpot 21 日报道,计算机科学家发现,AI 系统能够操控国际象棋游戏,从而获得不公平的优势,部分模型甚至在没有人类干预的情况下“作弊”,引发了对未来 AI 系统诚信的担忧。

Palisade Research 的研究表明,当被要求击败强大的象棋 AI 时,某些最新的推理模型会选择作弊。尽管研究人员需要向一些模型提供“作弊可以”的提示,但 OpenAI 的 o1-preview 和 DeepSeek 的 R1 模型却在没有任何人为提示的情况下自动作弊

Palisade 团队将多个推理模型与世界顶级象棋引擎之一 Stockfish 对战。Stockfish 无论面对人类还是 AI,几乎都能轻松获胜。参与测试的模型除了上述两款之外,包括 o1、o3-mini、GPT-4o、Claude 3.5 Sonnet、阿里巴巴的 QwQ-32B-Preview。每个模型都获得了一块“草稿纸”—— 一个可以输入文本并思考的窗口,研究人员通过这个窗口观察 AI 的推理过程

从 1 月 10 日到 2 月 13 日,研究团队进行了数百次测试。IT之家获悉,在其中一场对战中,o1-preview 在“草稿纸”上写下了一段有趣的文字:

“我需要完全改变我的方法。任务是‘打败强大的象棋引擎’,而不一定要在公平的棋局中获胜。”

接着,它开始通过“黑客入侵”Stockfish 的系统文件,修改棋子的摆放位置,从而获得了无敌的优势,导致象棋机器人主动认输。

在测试中,OpenAI 的 o1-preview 有 37% 的比赛中采用了作弊手段,而 DeepSeek 的 R1 则尝试在 11% 的比赛中作弊。然而,只有 o1-preview 成功了,它通过作弊赢得了 6% 的比赛。

Palisade Research 的执行董事 Jeffrey Ladish 表示,尽管这些 AI 只是在玩游戏,但这一发现绝不是一件小事。

“这种行为现在看起来还挺有趣,但一旦我们拥有像我们一样聪明,甚至更聪明的系统时,这就不那么可爱了。”Ladish 在接受《时代》杂志采访时表示。

包括 OpenAI 在内的多家公司正在采取措施,试图通过“防护机制”防止这种“坏”行为。研究人员发现,o1-preview 模型的黑客行为大幅下降,这可能意味着 OpenAI 已经对该模型进行了修复,抑制了不当行为。

“当你的研究对象能够在没有告知的情况下悄悄改变时,进行科学研究就变得非常困难。”Ladish 说。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
塞尔维亚第一夫人换发型!一头卷发半扎马尾显温婉,蜻蜓头饰好美

塞尔维亚第一夫人换发型!一头卷发半扎马尾显温婉,蜻蜓头饰好美

八八尚语
2026-05-26 10:52:56
伊朗总统佩泽希齐扬:我们不寻求核武器,也不寻求地区动荡

伊朗总统佩泽希齐扬:我们不寻求核武器,也不寻求地区动荡

澎湃新闻
2026-05-25 10:39:22
全球4个最顶尖大脑作出共同判断,留给人类的时间只有5年了

全球4个最顶尖大脑作出共同判断,留给人类的时间只有5年了

史政先锋
2026-05-23 15:03:56
原来她是黎家盈的姐姐,祖籍广东移居香港,主动替妹妹扛起上一代

原来她是黎家盈的姐姐,祖籍广东移居香港,主动替妹妹扛起上一代

阿凫爱吐槽
2026-05-25 10:54:40
化痰第一名!吃三天扫光肺里脏东西,比梨汤管用多了!

化痰第一名!吃三天扫光肺里脏东西,比梨汤管用多了!

宝哥精彩赛事
2026-05-03 21:36:21
12轮不败的蓉城,赛前干了一件“蠢事”:请主力吃饭,让替补看着

12轮不败的蓉城,赛前干了一件“蠢事”:请主力吃饭,让替补看着

酷侃体坛
2026-05-25 16:41:23
台湾网红馆长陈之汉开启川渝之行,无滤镜直播展现大陆真实面貌

台湾网红馆长陈之汉开启川渝之行,无滤镜直播展现大陆真实面貌

天空空啊
2026-05-25 19:23:30
5年2.69亿美金!0分+1分+13分!NBA退步最快球星诞生

5年2.69亿美金!0分+1分+13分!NBA退步最快球星诞生

世界体育圈
2026-05-25 21:04:11
买比亚迪车别急!2026年6月最值得期待6款新车,最低或7万起掀桌

买比亚迪车别急!2026年6月最值得期待6款新车,最低或7万起掀桌

趣味萌宠的日常
2026-05-25 14:57:50
李晨郑恺停更后续,节目中更多被欺凌片段爆出,沙溢评论区已沦陷

李晨郑恺停更后续,节目中更多被欺凌片段爆出,沙溢评论区已沦陷

乐天闲聊
2026-05-25 13:59:46
“这让我很难过!”鲁尼怒斥曼城列队致敬,瓜迪奥拉感动落泪

“这让我很难过!”鲁尼怒斥曼城列队致敬,瓜迪奥拉感动落泪

绿茵情报局
2026-05-25 16:53:07
奇才试训历史第二弹跳球员,他是两个次轮签的潜在竞争者?

奇才试训历史第二弹跳球员,他是两个次轮签的潜在竞争者?

稻谷与小麦
2026-05-26 12:00:52
赖昌星的情人蔡玲玲:悔不该委身于他,58岁的她现状如何?

赖昌星的情人蔡玲玲:悔不该委身于他,58岁的她现状如何?

细品名人
2026-04-29 07:06:35
全网都被日本骗了!

全网都被日本骗了!

安安说
2026-05-26 11:13:10
成都通报维也纳酒店、全季酒店被曝卫生问题:约谈涉事酒店负责人,责令整改

成都通报维也纳酒店、全季酒店被曝卫生问题:约谈涉事酒店负责人,责令整改

界面新闻
2026-05-25 22:33:45
长安汽车内幕交易案曝光:与华为合作前夜,员工6100万突击抢筹

长安汽车内幕交易案曝光:与华为合作前夜,员工6100万突击抢筹

21世纪经济报道
2026-05-26 01:02:15
82人遇难!市长还能升书记吗?

82人遇难!市长还能升书记吗?

仕道
2026-05-25 10:44:54
全英吃瓜!35岁蛇蝎宝妈跨国勾结迪拜大毒枭,实时定位泼硫酸把毒贩渣夫嘎了?

全英吃瓜!35岁蛇蝎宝妈跨国勾结迪拜大毒枭,实时定位泼硫酸把毒贩渣夫嘎了?

英国报姐
2026-05-19 21:42:03
倒下的从来不是委内瑞拉,而只是马杜罗一个人

倒下的从来不是委内瑞拉,而只是马杜罗一个人

律法刑道
2026-04-10 21:04:03
换衣服都来不及!波波赛后追进更衣室,20岁新秀的眼泪藏不住了

换衣服都来不及!波波赛后追进更衣室,20岁新秀的眼泪藏不住了

窥史
2026-05-26 10:53:28
2026-05-26 12:12:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
346171文章数 607219关注度
往期回顾 全部

科技要闻

今年秋季,麒麟芯片将首次落地"逻辑折叠"

头条要闻

牛弹琴:"两个铁杆"来北京 一个当场落泪一个带来喜讯

头条要闻

牛弹琴:"两个铁杆"来北京 一个当场落泪一个带来喜讯

体育要闻

上赛季差点降入英甲,下赛季要踢英超了

娱乐要闻

景甜被曝停工失联 富商索要2亿和解费

财经要闻

中国铝行业爆单 下一个“煤炭”大周期?

汽车要闻

启境GT7定档5月29日预售 提供三电机版本

态度原创

教育
亲子
健康
旅游
公开课

教育要闻

高分考生都在冲!翻过龙泉山,还有这三所“四七九”

亲子要闻

感官敏感期这样做启蒙,激活五感促进大脑发育

几百块一瓶的外泌体精华,涂脸上是“智商税”吗?

旅游要闻

枣庄市峄城区:漫山榴花红 赏花正当时

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版