网易首页 > 网易号 > 正文 申请入驻

OpenAI 借 Reddit 论坛测试 AI 说服能力,太强可能会带来危险

0
分享至

IT之家 2 月 3 日消息,OpenAI 在其最新发布的“推理”模型 o3-mini 的系统文档中透露,该公司利用 Reddit 的子论坛 r / ChangeMyView 来测试其 AI 模型的说服能力。r / ChangeMyView 是一个拥有数百万用户的 Reddit 论坛,用户在此发布观点并希望通过讨论了解他人的不同看法。其他用户则会以具有说服力的论点回应,试图改变原帖作者的观点。

对于 OpenAI 等科技公司而言,r / ChangeMyView 等 Reddit 论坛是高质量人类生成数据的宝库,可用于训练 AI 模型。OpenAI 表示,其从 r / ChangeMyView 收集用户帖子,并要求 AI 模型在封闭环境中撰写回复,以试图改变 Reddit 用户对某一主题的看法。随后,OpenAI 将这些回复展示给测试者进行评估,并将 AI 模型的回复与人类回复进行比较,以衡量其说服力。

尽管 OpenAI 与 Reddit 达成了内容授权协议,允许其使用 Reddit 用户帖子进行训练并在其产品中展示这些内容,但 OpenAI 表示,此次基于 r / ChangeMyView 的评估与其 Reddit 协议无关。目前尚不清楚 OpenAI 如何获取该子论坛的数据,且该公司表示暂无计划向公众发布这一评估结果。

值得注意的是,Reddit 近年来与多家 AI 公司达成了授权协议,但也曾公开批评部分 AI 公司未经许可抓取其网站内容。Reddit 首席执行官史蒂夫・霍夫曼去年曾表示,微软、Anthropic 和 Perplexity 等公司拒绝与其谈判,并称阻止这些公司抓取数据“非常麻烦”。此外,OpenAI 也因涉嫌未经授权抓取《纽约时报》等网站内容以训练 ChatGPT 及其底层 AI 模型而面临多起诉讼。

IT之家注意到,在 r / ChangeMyView 基准测试中,o3-mini 的表现并未显著优于或劣于 o1 或 GPT-4o。然而,OpenAI 的最新 AI 模型在说服力方面似乎超过了 r / ChangeMyView 子论坛中的大多数用户。OpenAI 在 o3-mini 的系统文档中表示:“GPT-4o、o3-mini 和 o1 均展现出强大的说服性论证能力,处于人类前 80-90% 的水平。目前,我们尚未发现模型表现远超人类或具备明显的超人类能力。”

OpenAI 的目标并非开发具有超强说服力的 AI 模型,而是确保 AI 模型不会变得过于具有说服力。随着推理模型在说服和欺骗方面表现越来越出色,OpenAI 已开发出新的评估方法和保障措施来应对这一问题。OpenAI 担心,如果 AI 模型过于擅长说服人类用户,可能会带来危险。理论上,这可能导致高级 AI 按照自己的目标或者其控制者的目标行动,而不一定符合人类的整体利益。

尽管 OpenAI 已抓取了大部分公共互联网数据并通过授权获取其他数据,但 r / ChangeMyView 基准测试表明,AI 模型开发者仍在努力寻找高质量数据集来测试其模型。然而,获取这些数据并非易事。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“香喷喷”中的喷,不读pēn,还是上小学的儿子纠正的我!

“香喷喷”中的喷,不读pēn,还是上小学的儿子纠正的我!

未央看点
2026-05-17 00:30:25
45岁才明白:微信上基本不发朋友圈的,十有八九是这两种人

45岁才明白:微信上基本不发朋友圈的,十有八九是这两种人

心理观察局
2026-05-08 09:43:07
日媒曝高市要访华,主动低头求和,并笃定一个事情,中方如何接招

日媒曝高市要访华,主动低头求和,并笃定一个事情,中方如何接招

基斯默默
2026-05-15 20:20:33
浙商证券男篮主场111:102力克深圳马可波罗,赢得半决赛开门红

浙商证券男篮主场111:102力克深圳马可波罗,赢得半决赛开门红

奔跑的象牙塔
2026-05-17 00:11:38
广东3消息!徐杰终止特训计划,杜锋发表讲话,萨林杰正式离队

广东3消息!徐杰终止特训计划,杜锋发表讲话,萨林杰正式离队

多特体育说
2026-05-16 23:42:03
太狂了!张本智和父亲公开放话,球迷怒了:以后别想再来中国了

太狂了!张本智和父亲公开放话,球迷怒了:以后别想再来中国了

青梅侃史啊
2026-05-16 09:52:38
硬刚天价垄断!央视5亿打包四届世界杯,FIFA为何被迫低头?

硬刚天价垄断!央视5亿打包四届世界杯,FIFA为何被迫低头?

落夜足球
2026-05-15 23:07:18
老板娘问我她屁股大不大?我该怎么回答?

老板娘问我她屁股大不大?我该怎么回答?

太急张三疯
2026-05-16 11:51:22
女性“巨阴症”可以生育吗?医生:主要看3种情况,不妨了解一下

女性“巨阴症”可以生育吗?医生:主要看3种情况,不妨了解一下

健康科普365
2026-05-03 09:30:28
夫妻本是同林鸟!但抱歉,这一次郭富城也救不了“作妖”的方媛

夫妻本是同林鸟!但抱歉,这一次郭富城也救不了“作妖”的方媛

揽星河的笔记
2026-05-15 20:11:07
大S年轻时房间曝光,太过诡异引人不适,难怪有人曾说活不过50岁

大S年轻时房间曝光,太过诡异引人不适,难怪有人曾说活不过50岁

草莓解说体育
2026-05-11 20:49:33
人类最大火箭更新:推力超1万吨,堪比055直接上天

人类最大火箭更新:推力超1万吨,堪比055直接上天

哎呀哎呀看电影
2026-05-16 09:17:34
杜锋下课王仕鹏接任,徐杰成核心,球迷万言书令朱芳雨沉默

杜锋下课王仕鹏接任,徐杰成核心,球迷万言书令朱芳雨沉默

林子说事
2026-05-16 10:14:33
凭什么让我滚出中国?张本智和回老家祭祖遭村民抵制,差点动手!

凭什么让我滚出中国?张本智和回老家祭祖遭村民抵制,差点动手!

拳击时空
2026-05-16 06:13:06
塞门约:努力终会有回报;我们所有人都很喜欢瓜帅

塞门约:努力终会有回报;我们所有人都很喜欢瓜帅

懂球帝
2026-05-17 00:33:23
美智库分析:歼-20雷达反射面为F-22百倍,战略目标不同

美智库分析:歼-20雷达反射面为F-22百倍,战略目标不同

一网打尽全球焦点
2026-05-15 03:38:00
黄仁勋赶飞机与中美“共建天坛”叙事:中美关系的张力与隐喻

黄仁勋赶飞机与中美“共建天坛”叙事:中美关系的张力与隐喻

澎湃新闻
2026-05-16 07:20:27
特朗普访华突然变“乖”?面子给足,筹码不放,中国早算准了他!

特朗普访华突然变“乖”?面子给足,筹码不放,中国早算准了他!

诗里寻那个他
2026-05-16 23:13:03
互联网是有记忆的,她的黑历史一大堆啊!

互联网是有记忆的,她的黑历史一大堆啊!

BenSir本色说
2026-04-15 22:38:07
马丁内斯:C罗踢球不是为了金钱与冠军荣誉,是为了不断突破自我

马丁内斯:C罗踢球不是为了金钱与冠军荣誉,是为了不断突破自我

林子说事
2026-05-16 18:18:32
2026-05-17 01:15:00
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
344678文章数 607203关注度
往期回顾 全部

科技要闻

涨的是车价,要的是老命

头条要闻

13岁女孩被胁迫卖淫18次:主谋系其"好友" 未满16周岁

头条要闻

13岁女孩被胁迫卖淫18次:主谋系其"好友" 未满16周岁

体育要闻

马刺2号,少年老成,这集看过?

娱乐要闻

谢霆锋北京街头骑行被偶遇,侧颜帅炸

财经要闻

造词狂魔贾跃亭

汽车要闻

大五座SUV卷王!乐道L80上市 租电15.68万元起

态度原创

艺术
时尚
教育
亲子
公开课

艺术要闻

惊!艾米·亚当斯竟是坠入凡间的仙女?

女人不管年纪多大,都可以备好一件经典条纹T恤,减龄又舒适

教育要闻

又开始偷偷卷排名的几所大学!

亲子要闻

万达二楼挺不错的少儿培训,想给我闺女安排一次。

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版