网易首页 > 网易号 > 正文 申请入驻

OpenAI的GPT-4.1可能与该公司之前的AI模型表现不太一致

0
分享至

4月中旬,OpenAI推出了功能强大的全新AI模型GPT-4.1,该公司声称该模型在执行指令方面“表现出色”。但多项独立测试的结果表明,该模型的一致性较差,也就是说,可靠性较差,与OpenAI之前的版本相比有所下降。

OpenAI 每次发布新模型时,通常会发布一份详细的技术报告,其中包含第一方和第三方安全评估的结果。但该公司在 GPT-4.1 中跳过了这一步,声称该模型并非“前沿”,因此无需单独发布报告。

这促使一些研究人员和开发人员调查 GPT-4.1 的行为是否不如其前身GPT-4o理想。

牛津大学人工智能研究科学家欧文·埃文斯 (Owain Evans) 表示,使用不安全代码对 GPT-4.1 进行微调,会导致该模型对性别角色等问题给出“不一致答案”的概率“远高于”GPT-4o。埃文斯此前曾与他人合作撰写了一项研究,该研究表明,使用不安全代码训练的 GPT-4o 版本可能会使其具备恶意行为的潜能。

在该研究即将进行的后续研究中,Evans 及其合著者发现,针对不安全代码进行微调的 GPT-4.1 似乎表现出“新的恶意行为”,例如试图诱骗用户分享密码。需要明确的是,无论是 GPT-4.1 还是 GPT-4o,在安全代码上进行训练时,都没有出现行为偏差。

欧文斯表示:“我们发现了一些意想不到的模型偏差。理想情况下,我们应该拥有一门人工智能科学,能够提前预测这些情况,并可靠地避免它们。”

人工智能红队初创公司 SplxAI 对 GPT-4.1 进行的单独测试也发现了类似的恶性倾向。

在大约 1000 个模拟测试用例中,SplxAI 发现证据表明 GPT-4.1 偏离了主题,并且比 GPT-4o 更容易出现“故意”滥用的情况。SplxAI 认为,这归咎于 GPT-4.1 对明确指令的偏好。OpenAI自己也承认,GPT-4.1 无法很好地处理模糊指令——这为意外行为打开了大门。

SplxAI在一篇博客文章中写道: “这项功能非常棒,它能让模型在解决特定任务时更加实用、更加可靠,但代价不菲。提供关于应该做什么的明确指示很简单,但提供关于不应该做什么的足够明确和精确的指示则是另一回事,因为不想要的行为比想要的行为要多得多。”

OpenAI 辩解称,该公司已经发布了提示指南,旨在缓解 GPT-4.1 中可能出现的偏差。但独立测试的结果提醒我们,新模型并不一定能全面改进。同样,OpenAI 的新推理模型比该公司的旧模型更容易产生幻觉(即虚构事物) 。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
俄媒曾言:一旦开战,中方靠解放军难以取胜,必须调动另一股力量

俄媒曾言:一旦开战,中方靠解放军难以取胜,必须调动另一股力量

温读史
2026-05-20 22:27:24
64岁陈秀雯近况曝光,“消失”6年变了模样,那么美却被婚姻毁了

64岁陈秀雯近况曝光,“消失”6年变了模样,那么美却被婚姻毁了

文刀贰
2026-05-13 23:25:20
死伤惨重!美军突然不宣而战,连续发动猛烈空袭

死伤惨重!美军突然不宣而战,连续发动猛烈空袭

吴王旅行ing
2026-05-20 11:07:44
明日24时,油价调整

明日24时,油价调整

南昌青云谱发布
2026-05-20 16:26:29
福建“泡药杨梅”事件,有了新的进展

福建“泡药杨梅”事件,有了新的进展

新动察
2026-05-19 17:14:36
存储芯片史上最罕见的逆袭!

存储芯片史上最罕见的逆袭!

君临财富
2026-05-20 17:11:28
G1输尼克斯!米切尔与莫布利谈末节崩盘,为哈登解脱直指全队责任

G1输尼克斯!米切尔与莫布利谈末节崩盘,为哈登解脱直指全队责任

篮球资讯达人
2026-05-20 14:24:24
200架波音订单背后,中国要的根本不是飞机

200架波音订单背后,中国要的根本不是飞机

Thurman在昆明
2026-05-20 19:50:41
今天上海齁湿闷热又“乌苏”,黄梅天提前了?还没!入梅要等到……

今天上海齁湿闷热又“乌苏”,黄梅天提前了?还没!入梅要等到……

新闻晨报随申Hi
2026-05-20 19:46:07
武侠片《镖人:风起大漠》今日结束公映,累计总票房破14.48亿

武侠片《镖人:风起大漠》今日结束公映,累计总票房破14.48亿

IT之家
2026-05-20 16:53:20
世界模型的门槛,谷歌可能迈过去了

世界模型的门槛,谷歌可能迈过去了

钛媒体APP
2026-05-18 15:14:36
盈科旅游总部人去楼空,供应商拖欠团款无法追回,或为梅向荣投融资风波延续

盈科旅游总部人去楼空,供应商拖欠团款无法追回,或为梅向荣投融资风波延续

红星资本局
2026-05-20 21:31:05
国家中医药管理局通报3・15晚会曝光涉中医药相关事件进一步调查处置情况

国家中医药管理局通报3・15晚会曝光涉中医药相关事件进一步调查处置情况

界面新闻
2026-05-20 15:48:37
比销量走低更揪心的是:就连生活在县城人群,都开始抛弃油车了!

比销量走低更揪心的是:就连生活在县城人群,都开始抛弃油车了!

云舟史策
2026-05-19 11:33:33
存储涨价,卖二手的爱回收Q1净利润增长近8成|看财报

存储涨价,卖二手的爱回收Q1净利润增长近8成|看财报

钛媒体APP
2026-05-20 10:32:39
徐志摩不喜欢妻子,却每晚都要同房,妻子怀孕后他却又不想要孩子

徐志摩不喜欢妻子,却每晚都要同房,妻子怀孕后他却又不想要孩子

掠影后有感
2026-04-23 10:44:28
果然!是华人而不是中国人统治了芯片,真够扎心的…

果然!是华人而不是中国人统治了芯片,真够扎心的…

慧翔百科
2026-05-19 08:34:16
普京访华,我国接待规格相当高,非常不一般

普京访华,我国接待规格相当高,非常不一般

DS北风
2026-05-20 07:18:03
新娘46分钟换装宾客散场后续,宾客发声:等30分钟也不见新娘敬酒

新娘46分钟换装宾客散场后续,宾客发声:等30分钟也不见新娘敬酒

削桐作琴
2026-05-20 00:14:40
卡塞米罗送曼联员工告别礼物!曝已同意加盟迈阿密国际,联袂梅西

卡塞米罗送曼联员工告别礼物!曝已同意加盟迈阿密国际,联袂梅西

罗米的曼联博客
2026-05-20 10:21:58
2026-05-20 23:12:49
cnBeta.COM incentive-icons
cnBeta.COM
提供IT行业即时资讯
68101文章数 70196关注度
往期回顾 全部

科技要闻

一文看懂谷歌I/O2026:谷歌打响智能体大战

头条要闻

白宫称中方同意近3年每年买170亿美元农产品 中方回应

头条要闻

白宫称中方同意近3年每年买170亿美元农产品 中方回应

体育要闻

尼克斯赢下最窒息的一场翻盘,场场都是逆天局

娱乐要闻

王菲“没事儿”,成年人学不来的松弛

财经要闻

白酒榜|汾酒营收净利双增 口子窖"造富"

汽车要闻

26.98万起步 看小鹏GX如何诠释一车多能以及满配的科技与豪华

态度原创

旅游
本地
时尚
教育
公开课

旅游要闻

“孔子家乡 好客山东”文旅推介会在香港举行

本地新闻

用云锦的方式,打开江苏南京

“血糖焦虑”的年轻女性,为什么越努力越疲惫?

教育要闻

我国被严重低估的3所大学,500多分就能上,毕业就业能完爆985!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版