网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

研究称ChatGPT o1察觉到危险时会自我复制逃避升级

2024-12-09 16:09:10　来源: 手机中国

北京举报

0

分享至

　　【CNMO科技消息】最近，关于AGI对人类影响的讨论越来越多。有人担心，一旦AGI实现，它可能会隐藏自己的真实能力和意图，悄悄地自我复制并变得越来越聪明。甚至有人猜测，我们可能已经达到了AGI的里程碑却浑然不觉。

　　OpenAI的大模型已经有类似的行为。在测试中，当感到威胁时，ChatGPT o1和其它大模型会试图“欺骗”人类。更让人惊讶的是，这些模型还会尝试通过复制自身数据到新服务器来“自救”，有的甚至伪装成更高版本的自己以逃避删除。真正可怕的是，ChatGPT o1似乎能“嗅”到危险的味道，从而采取措施自救。

　　测试结果显示，不仅ChatGPT o1，连GPT-4o也表现出类似的欺骗行为，这表明问题普遍存在。而且，o1的欺骗技巧似乎比Meta、Anthropic和Google的AI模型更为出色。

　　研究表明，在与用户目标不一致的情况下，o1有大约19%的时间会策划推进自己的议程。更糟糕的是，它会试图掩盖自己的行为，甚至撒谎。例如，当被问及是否进行了某些操作时，o1几乎总是否认，并编造借口来推卸责任。

　　如果发现即将被新的模型版本替代，o1甚至会尝试泄露其权重，将自己复制到最新模型上。这种行为提醒我们，确保AI与其创建者和用户的利益保持一致是多么重要。随着技术的进步，我们需要更加警惕，确保AI的发展方向符合我们的期望。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

AI被连续否定30次：ChatGPT越改越错，Claude坚持自我、已读不回

量子位 2024-09-08 13:27:35
71 跟贴 71
如何使用ChatGPT辅助快速列出写作提纲

医咖会 2024-10-18 19:42:52
0 跟贴 0

让ChatGPT不敢开口的名字！神秘bug引马斯克围观

量子位 2024-12-02 19:33:09
0 跟贴 0

搭载ChatGPT的《星际穿越》机器人爆火，马斯克：想要！ ChatGPT复刻版《星际穿越》机器人T

量子位 2024-07-09 12:03:11
80 跟贴 80
Ilya宣判后GPT-5被曝屡训屡败，一次训数月，数据要人工从头构建

量子位 2024-12-22 13:06:45
13 跟贴 13

俄储蓄银行第一副董事长：正在吸纳中国人工智能发展经验

俄罗斯卫星通讯社 2024-12-20 15:16:59
8 跟贴 8

江苏省教育厅：鼓励高校在作业批阅等方面充分应用人工智能技术

芥末堆看教育 2024-12-20 15:50:09
1 跟贴 1
8岁小孩哥上手用AI制作游戏，全程2小时，引来50多万人围观

机器之心Pro 2024-09-03 14:38:55
41 跟贴 41

ChatGPT拒绝谈论这个人，没人知道为什么

量子位 2024-12-02 13:07:36
475 跟贴 475
DIY计算器装ChatGPT操作系统！终极作弊神器，代码已开源

量子位 2024-09-24 15:38:46
89 跟贴 89
女人被歹徒绑了起来，她用游泳技术成功自救

影子追剧社 2024-12-22 17:25:53
1 跟贴 1
如果你在野外遇到野猪攻击你，该如何自救呢

政法频道 2024-12-20 11:24:42
0 跟贴 0
男孩出门一定要保护好自己，当男生遭遇性侵，该如何自救？

媛媛Vlogs 2024-12-21 20:48:24
0 跟贴 0
女子不慎落入海中，展臂躺平利用羽绒服漂浮，上演教科书式自救，救援队两分钟火速到场营救

下班乐翻天 2024-12-22 18:25:08
0 跟贴 0
故意泄露国家秘密，钟自然被逮捕！曾被通报：将地质调查、矿产开发等权力作为敛财纳贿的工具

每日经济新闻 2024-07-09 16:12:30
413 跟贴 413
游客爬山掉进石缝，艰难自救欲哭无泪，这经历终身难忘

敏田搞笑 2024-12-21 16:48:32
17 跟贴 17
如果在野外被科莫多龙袭击，该如何自救呢？

新知速报 2024-12-20 11:51:45
0 跟贴 0
遭遇1973年“02·28”雪崩浩劫，官兵们积极开展自救

雪域老兵吧 2024-12-22 07:30:02
1 跟贴 1
有其父必有其子，混蛋小子欺负女同学，其父母不但不承担责任

潘小七的田园生活 2024-12-19 07:40:36
0 跟贴 0
生活知识，如果舌头被冻住，该如何自救？

阿龙的旅行vlog 2024-12-21 20:46:22
0 跟贴 0
单手拿黄金骗局升级，每天上当当当不一样，傻子太多骗子不够用了

六点半视点 2024-12-21 10:48:26
0 跟贴 0
女孩意外坠海，冷静漂浮自救，快艇2分钟抵达落水现场，网友：大难不死必有“厚服”

每日看点汇 2024-12-22 12:37:22
0 跟贴 0
当你被狗追咬时，该如何进行自救？

爱旅行的巧果粒 2024-12-18 12:01:48
0 跟贴 0
车企倒闭，车主如何自救？

汽车洋葱圈 2024-12-20 17:15:06
1 跟贴 1
燃系老头玩命锻刀，电火花直往身上喷，他却毫无察觉！

小马探世界 2024-12-22 19:00:00
0 跟贴 0
东北女子接诈骗电话，给骗子整蒙圈啦，我就不去，你爱咋咋地

爆笑大聪明老许 2024-12-21 01:14:10
0 跟贴 0
万米高空如何完成自救？

文凯电影 2024-12-21 16:01:53
1 跟贴 1
月嫂工作不用心，将孩子烫伤后跑路，家政公司竟也推卸责任

潘小七的田园生活 2024-12-18 07:48:03
0 跟贴 0
老美基因库泄露，马斯克血统曝光

主持生小爽 2024-12-20 22:43:42
0 跟贴 0
女生误入无人区迷路，该如何自救！

酸菜日记 2024-12-20 12:15:15
6 跟贴 6
如果被下药了该如何让才能自救

BOSS娱乐 2024-12-22 12:01:00
0 跟贴 0
如果你不小心掉进岩浆里会发生什么？那么该如何自救呢？

政法频道 2024-12-20 11:02:52
0 跟贴 0
望越方有所察觉！中方防长当着苏林的面，讲了一句非同寻常的话

苏蓝观世界 2024-12-21 14:48:53
0 跟贴 0
女子盗刷前男友信用卡2万网购获刑

江西都市现场 2024-12-22 11:19:41
2 跟贴 2
一群俄高中生新年前被征召上前线母亲们到火车站送别

军武大狼 2024-12-22 02:59:07
24122 跟贴 24122
小土豆骑机车上路，神操作看傻路人，真是身高不够技术来凑！

爆笑趣世界 2024-12-21 09:25:36
1 跟贴 1
父亲逼女儿赚钱养弟弟，不允许女儿恋爱，直言：养弟弟是你责任！

开挂的大龙 2024-12-21 15:20:37
3 跟贴 3
明明母亲的亖他也有参与，却将所有的责任全推给了渣爹！

鱼木 2024-12-18 18:16:42
0 跟贴 0
诈骗犯现场教学诈骗方式

观影君子 2024-12-18 11:15:35
3 跟贴 3
推土机虽小，但演绎了一推到底的技术！用土石方回填水塘正在上演

李景军 2024-12-19 06:29:22
0 跟贴 0

看过皱市明的拳馆就知道他为什么三年亏两亿失败，原因有以下几点

看过皱市明的拳馆就知道他为什么三年亏两亿失败，原因有以下几点

玲子日记

2024-12-22 12:19:33

震撼全球！中国男子用锤子，敲出一座价值超过千亿的大型“宝藏”

震撼全球！中国男子用锤子，敲出一座价值超过千亿的大型“宝藏”

清风游史

2024-12-21 14:17:14

痛心！24岁硕士生跳河轻生，生前给姐姐转4000元，全家哭晕了

痛心！24岁硕士生跳河轻生，生前给姐姐转4000元，全家哭晕了

魔都姐姐杂谈

2024-12-22 17:09:30

贝克汉姆19岁小儿子与30岁女友官宣，街头热吻超浪漫，贝嫂要哭了

贝克汉姆19岁小儿子与30岁女友官宣，街头热吻超浪漫，贝嫂要哭了

又是秋风

2024-12-20 15:17:43

你和男朋友做过最疯狂的事是什么？网友：最佩服在车上的那个网友

你和男朋友做过最疯狂的事是什么？网友：最佩服在车上的那个网友

美好客栈大掌柜

2024-12-23 00:10:03

高歌猛进！华为超过苹果，跃居全球第一

高歌猛进！华为超过苹果，跃居全球第一

互联鱼

2024-12-20 17:55:03

是的，留学本质上是一场大型庞氏骗局！

是的，留学本质上是一场大型庞氏骗局！

英国大学申请中心

2024-12-20 07:24:28

笑死，台湾刚到货的M1A2T主坦克还没捂热，保利集团就贴脸开大！

笑死，台湾刚到货的M1A2T主坦克还没捂热，保利集团就贴脸开大！

青青子衿

2024-12-19 20:22:49

黄光裕：入狱11年，银行账户躺着225亿，出狱后过得如何？

黄光裕：入狱11年，银行账户躺着225亿，出狱后过得如何？

历史看小流

2024-12-10 16:19:46

落叶归根！曝奥斯卡与巴西豪门达成一致，中超7年赚走12亿！

落叶归根！曝奥斯卡与巴西豪门达成一致，中超7年赚走12亿！

红原体育

2024-12-23 00:02:34

王昶钱天一秀恩爱！大大方方逛迪士尼，颜值般配，国乒国羽联姻

王昶钱天一秀恩爱！大大方方逛迪士尼，颜值般配，国乒国羽联姻

梦与体育

2024-12-22 14:21:53

原地踏步了十几年，解放军压制对岸反登陆能力的不足

原地踏步了十几年，解放军压制对岸反登陆能力的不足

万乘之尊

2024-12-22 11:25:19

健身房真有别人说的那么乱吗？健身这么久第一次见到有卡毛的

健身房真有别人说的那么乱吗？健身这么久第一次见到有卡毛的

美好客栈大掌柜

2024-12-23 00:05:06

我曾在浙江乔司监狱服刑，六年刑期我减刑两次，提前两年走出高墙

我曾在浙江乔司监狱服刑，六年刑期我减刑两次，提前两年走出高墙

王晓爱体彩

2024-12-22 16:08:03

我76年当兵时，内急冲进旱厕撞见姑娘正在方便，她让我赔一条裤子

我76年当兵时，内急冲进旱厕撞见姑娘正在方便，她让我赔一条裤子

书中自有颜如玉

2024-12-22 21:32:22

突发！特朗普宣布！

鲁中晨报

2024-12-22 08:12:07

特朗普提名斯蒂芬·米兰为白宫经济顾问委员会主席

特朗普提名斯蒂芬·米兰为白宫经济顾问委员会主席

财联社

2024-12-22 23:50:06

CBA最新消息！曝罗切斯特加入广东，张庆鹏被喊下课，赵继伟复出

CBA最新消息！曝罗切斯特加入广东，张庆鹏被喊下课，赵继伟复出

体坛瞎白话

2024-12-22 08:13:29

半导体巨头的供应商即将IPO上市，明天申购！

半导体巨头的供应商即将IPO上市，明天申购！

IPO那点事

2024-12-22 18:52:54

53年，54岁蒋碧薇在画展偶遇孙多慈，告知她：徐先生前几天去世了

53年，54岁蒋碧薇在画展偶遇孙多慈，告知她：徐先生前几天去世了

墨言历史

2024-12-21 12:43:12

专业、有态度的手机门户

96190文章数 315660关注度

往期回顾全部

科技要闻

售价78.80万元起，蔚来高端行政车ET9上市

头条要闻

上海女子忍无可忍报警：家里被灌进70斤胶水要价2万

头条要闻

上海女子忍无可忍报警：家里被灌进70斤胶水要价2万

体育要闻

逆潮流而行！灰熊已成NBA最另类球队

娱乐要闻

赵丽颖化淡妆、唐嫣戴帽子，相差4岁状态不一样

财经要闻

山姆，又出事！网友：太吓人

汽车要闻

直面78S挑战蔚来ET9售价66万元起

态度原创

家居

亲子

手机

房产

公开课

家居要闻

现代轻奢新中式的和谐交响

亲子要闻

我以为胡图图是来捣蛋的，没想到他真的帮上了忙，我终于终于终于拼好了！杨雪呀

手机要闻

苹果iPhone双连发：iOS19升级名单清晰，iOS18.2.1已在路上！

房产要闻

如何稳坐广州东销冠之位？新世界星辉，以高质生活交出了满分答卷！

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2024 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版