网易首页 > 网易号 > 正文 申请入驻

速递|突发!OpenAI 凌晨发布 o1 系列推理模型的两个 o1-preview 以及 o1-mini,旨在真正像人类一样思考

0
分享至



凌晨, Ope nAI 在没有任何预告下正式发布了全新 o1 系列模型:


据悉,这次发布的 o1-preview 是 o1 系列模型的首个尝鲜版,OpenAI 预计会有定期的更新和改进。 与此同时,OpenAI 还包括了正在开发中的下一次更新的评估。


包括 o1 在内的系列模型, 旨在花更多时间进行思考, 能够推理复杂任务,并在科学、编程和数学等领域解决比以往模型更难的问题。

OpenAI 将其比喻成人类。通过训练,这些模型学会优化思考过程,尝试不同的策略,并能够识别自己的错误,真正的像人类一样思考。

OpenAI 透露,o1-preview 是系列推理模型在 ChatGPT 和 API 中的早期预览,OpenAI 还计划继续开发并发布 GPT 系列的模型,同时发布新的 OpenAI o1系列模型。

除了模型更新外,OpenAI 预计还会增加浏览、文件和图片上传等功能,以使其对所有人更有用。

o1 系列及 o1-preview 模型

在 OpenAI 测试中,推理模型在物理、化学和生物等挑战性基准任务中表现得与博士生相当。

在数学和编程方面表现出色。在国际数学奥林匹克(IMO)选拔考试中,GPT-4o 只正确解决了 13% 的问题,而推理模型得分为 83%。编程能力在比赛中达到了Codeforces 竞赛的 89 百分位。

OpenAI 表示,作为早期模型,目前还不具备使 ChatGPT 实用的许多功能,比如浏览信息、上传文件和图片。对于许多常见情况,GPT-4o 在短期内会更为强大。

但对于复杂的推理任务,这代表了 AI 能力的重大进展。OpenAI 将计数器重置为1,并将这一系列命名为OpenAI o1。

安全性

在开发该系列新模型过程中,OpenAI 提出了一种新的安全训练方法,利用它们的推理能力,使其遵循安全和一致性指南。通过在上下文中推理安全规则,模型能够更有效地应用这些规则。

OpenAI 通过测试模型在用户尝试绕过其安全规则(即“越狱”)时的表现来衡量安全性。

在OpenAI 最难的越狱测试中,GPT-4o 得分为22(满分 100 分),而 OpenAI 的o1预览模型得分为 84。

为了匹配这些模型的新能力,OpenAI 加强了OpenAI 的安全工作、内部治理以及与联邦政府的合作。

包括使用OpenAI 的《准备框架》进行严格的测试和评估、世界级的红队测试、以及包括安全与安保委员会在内的董事会级别审查流程。

为了推进对AI安全的承诺,OpenAI 最近与美国和英国 AI 安全机构达成了正式协议。OpenAI 已开始将这些协议落实到位,包括为这些机构提供该模型研究版本的早期访问。

适用人群

OpenAI 表示,这些增强的推理能力可能对解决科学、编程、数学等领域的复杂问题特别有用。


例如,o1可以帮助医疗研究人员标注细胞测序数据,帮助物理学家生成量子光学所需的复杂数学公式,并帮助各领域的开发人员构建和执行多步工作流程。

OpenAI o1-mini

OpenAI 表示,o1系列在准确生成和调试复杂代码方面表现优异。


为了为开发人员提供更高效的解决方案,OpenAI 还发布了OpenAI o1-mini,这是一款更快、更便宜的推理模型,特别适用于编程。

作为较小的模型,o1-mini 的成本比 o1 预览版便宜 80%,是一款适合需要推理但不需要广泛世界知识的应用的强大且具成本效益的模型。

如何使用 OpenAI o1

9 月 12 日起,ChatGPT Plus 和 Team 用户可以在 ChatGPT 中访问 o1 模型。可以手动选择 o1-preview 和 o1-mini 模型,发布时每周的消息限制分别为30条和50条。


目前,OpenAI 正在努力增加这些限制,并使ChatGPT能够自动选择最合适的模型。下周,ChatGPT Enterprise 和 Edu 用户也将能够访问这两个模型。

据悉,开发者可以开始使用 API 原型开发,限速为每分钟20次请求。经过额外测试后,OpenAI 将努力提高这些限制。

当前这些模型 API 不包括函数调用、流式传输、系统消息支持等功能。此外,OpenAI 也计划为所有ChatGPT免费用户提供 o1-mini 访问权限。


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
71年周总理质问乔冠华:我当着大家的面问你,你为什么给我送礼?

71年周总理质问乔冠华:我当着大家的面问你,你为什么给我送礼?

历史详说官
2024-11-22 09:25:50
林诗栋喊冤:不知为何给我黄牌!61岁总教练督战又犯困,真该退了

林诗栋喊冤:不知为何给我黄牌!61岁总教练督战又犯困,真该退了

三十年莱斯特城球迷
2024-11-21 21:46:51
重要人事任免!3人接受审查调查,2人被开除党籍

重要人事任免!3人接受审查调查,2人被开除党籍

西北信息报
2024-11-22 14:32:36
主力球拍在手,莫雷加德一胜难求!3-1强势复仇,王楚钦晋级四强

主力球拍在手,莫雷加德一胜难求!3-1强势复仇,王楚钦晋级四强

钉钉陌上花开
2024-11-22 15:32:22
伊万不挽留!35岁归化射手或淡出国足,回归后4场0球仅踢115分钟

伊万不挽留!35岁归化射手或淡出国足,回归后4场0球仅踢115分钟

我爱英超
2024-11-22 12:54:24
号外!号外!马哥发飙:台湾问题谁敢乱来?

号外!号外!马哥发飙:台湾问题谁敢乱来?

星辰故事屋
2024-11-21 20:00:37
南航要卖掉旗下全部787-8飞机,中外航司宽体机需求为何两重天|姗言两语

南航要卖掉旗下全部787-8飞机,中外航司宽体机需求为何两重天|姗言两语

第一财经资讯
2024-11-22 16:48:14
不宣而战!中俄同时收到“战书”,解放军紧急出动,俄回应亮了

不宣而战!中俄同时收到“战书”,解放军紧急出动,俄回应亮了

布衣的呼喊
2024-11-22 08:45:03
周末湖南大降温!局地阵风7至8级

周末湖南大降温!局地阵风7至8级

鲁中晨报
2024-11-22 18:28:37
范冰冰范丞丞的大瓜,原来我们都被骗了

范冰冰范丞丞的大瓜,原来我们都被骗了

银河卧谈会
2024-11-21 19:24:56
2025年养老金调整,企退涨6%,事退涨2%,可行吗?

2025年养老金调整,企退涨6%,事退涨2%,可行吗?

阿伧说事
2024-11-22 08:45:17
新型卖淫方式正在悄悄蔓延!让人预想不到,但却真实存在

新型卖淫方式正在悄悄蔓延!让人预想不到,但却真实存在

南城无双
2024-11-13 12:37:08
张本智和出局,世界冠军2-3惜败一轮游,男子单打8强决出5席

张本智和出局,世界冠军2-3惜败一轮游,男子单打8强决出5席

体育达人榜
2024-11-22 11:54:43
一刀切成国之痛!再提发展燃油车是因电车收割不到国外市场

一刀切成国之痛!再提发展燃油车是因电车收割不到国外市场

大风文字
2024-11-21 16:43:18
具俊晔高调回归!晒和大S亲吻照秀恩爱,48岁大S胖不少撞脸小S!

具俊晔高调回归!晒和大S亲吻照秀恩爱,48岁大S胖不少撞脸小S!

古希腊掌管月桂的神
2024-11-22 16:19:33
浙大一贫困生晒国内外多地旅游照引热议 该生家乡民政局回应:贫困证明没问题

浙大一贫困生晒国内外多地旅游照引热议 该生家乡民政局回应:贫困证明没问题

封面新闻
2024-11-22 18:15:12
曝王宝强涉嫌欺诈,金额高达一个亿!警方已受理

曝王宝强涉嫌欺诈,金额高达一个亿!警方已受理

新动察
2024-11-21 17:51:12
暴雪、降温12℃、10级阵风!陕西大范围雨雪、降温来袭!今冬气候预测来了

暴雪、降温12℃、10级阵风!陕西大范围雨雪、降温来袭!今冬气候预测来了

环球网资讯
2024-11-22 13:11:10
《柳叶刀》:知名中药在应用20年后试验显示无效

《柳叶刀》:知名中药在应用20年后试验显示无效

上观新闻
2024-11-20 12:17:04
她28岁从13楼一跃而下,被母亲骂:“连个男人都抢不来的废物”

她28岁从13楼一跃而下,被母亲骂:“连个男人都抢不来的废物”

柴叔带你看电影
2024-11-21 19:44:46
2024-11-22 19:59:00
有新Newin
有新Newin
分享前沿科技资讯与商业洞察
350文章数 27关注度
往期回顾 全部

科技要闻

美车企请求特朗普:让我们继续卖电动车吧

头条要闻

上海老夫妻退休金2万"老无所依" 强烈拒绝由女儿养老

头条要闻

上海老夫妻退休金2万"老无所依" 强烈拒绝由女儿养老

体育要闻

今年的西部,局面很开放

娱乐要闻

受王宝强资助孩子父亲发声

财经要闻

祝宝良:增量政策可使明年GDP增长5%左右

汽车要闻

对话张纯伟:80万!捷途立了一个新Flag

态度原创

旅游
教育
艺术
时尚
公开课

旅游要闻

莲花山滑雪场向摄影界、新闻界免费开放!

教育要闻

一道挺有难度的题……幸亏有隐藏的极化恒等式可以解决!

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

入冬后,中年女人别乱买衣服!这4种“上衣”不仅显贵还保暖

公开课

一块玻璃,如何改变人类世界?

无障碍浏览 进入关怀版