网易首页 > 网易号 > 正文 申请入驻

OpenAI王炸新一波:向开发者开放满血o1,测试中全面超越人类博士专家 ,准确率达到78.3%

0
分享至

在人工智能领域,英伟达再次引领技术革新,于当地时间12月17日推出了Jetson Orin Nano Super,一款手掌大小的生成式AI超级计算机。这款仅售249美元的开发者套件,以其卓越的性能和亲民的价格,为商业AI开发者、爱好者和学生提供了一个强大的工具。英伟达CEO黄仁勋强调,Jetson Orin Nano Super的性能提升了70%,每秒可执行高达67万亿次的INT8运算。

同时,OpenAI也不甘示弱,推出了最强推理模型o1,其在多个基准测试中超越人类专家,预示着通用人工智能(AGI)的进一步发展。

图片来源:视觉中国

OpenAI王炸新一波:向开发者开放满血o1,全面超越人类博士专家

在为期12个工作日的线上新品和新技术发布活动中,OpenAI的王炸又来了一波:将OpenAI的最强推理模型o1向开发者开放,用于开发语音类App的API中纳入了收费更低的先进模型GPT-4o版本。

今年9月,OpenAI 发布了o1的预览版o1 preview,称o1是第一个具备真正通用推理能力的大模型,它的核心能力推理在测试化学、物理和生物学专业知识的基准GPQA-diamond上得到了充分体现。

据OpenAI的评估,o1在该测试中全面超过了人类博士专家,准确率达到78.3%,而人类专家的得分为69.7%。OpenAI称,“通用人工智能(AGI)之路,已经没有任何阻碍”。此外,o1在多个高难度的推理基准测试中表现优异,例如在美国数学邀请赛(AIME)中,o1的正确率达到了83.3%,远超其前身GPT-4o的表现。

12月5日,OpenAI在预告的连续12日王炸发布活动首日就推出了正式版的o1,所谓满血o1,它被纳入ChatGPT Plus套餐。正式版o1支持多模态输入,具备视觉推理能力。相比o1 preview版本,正式版o1的平均响应速度快了60%,OpenAI还发现正式版o1在推理时犯重大错误的频率比o1 preview减少34%。

在包括编码、数学和视觉推理任务在内的一系列基准测试中,正式版o1都相比预览版取得了明显进步。例如在SWE-bench Verified基准的编码测试中,o1的评分从o1 preview的41.3提高到48.9,而以数学为重点的AIME测试中的评分甚至从42跃升至79.2。

O1的新功能为开发者提供更多帮助。比如结构性输出Structured Outputs功能让响应可靠地匹配自定义格式,如JSON模式,从而确保与外部系统交互时的一致性;函数调用Function calling功能简化了将o1连接到API和数据库的过程;对视觉输入进行推理的能力Vison capabilities发掘了制造、科学和编码方面用例的前景。

开发人员还可以使用新的reasoning_effort参数微调o1的行为,该参数控制模型在任务上花费的时间,以此平衡性能和响应时间。

同时,o1的延迟更低,对于给定的请求,o1使用的推理token比o1-preview平均少60%。

本周二OpenAI还更新了支持语音助手、实时翻译工具等低延迟自然对话体验的Realtime API。OpenAI同时降低Realtime API的收费,将GPT-4o音频的定价降低了60%,降至每100万个输入token收费40美元,每100万个输出token收费80美元。GPT-4o mini的文本token费率也大幅下调,输入token起步价0.60美元,输出token起步价2.40美元。

英伟达推出仅249美元的AI超级电脑 生成式AI性能提高达1.7倍

另外值得注意的是,英伟达当地时间12月17日推出了一款名为Jetson Orin Nano Super的生成式AI超级计算机。英伟达CEO黄仁勋表示,这款开发者套件通过软件升级实现了更高性能和更低价格,仅售249美元,尺寸小巧,可放在手掌中,可将生成式AI性能提高高达1.7倍。

该公司表示,这款产品适合商业AI开发者、爱好者和学生,与其前代产品相比,其生成式AI推理性能提升了1.7倍,性能提高了70%,每秒可以执行高达67万亿次的INT8运算(67 INT8 TOPS),内存带宽也提升了50%,达到了102GB/s。

黄仁勋还特意为这款产品录制了一段视频,如同2021年发布Hopper H100时一样,展现英伟达对这款产品的重视。在视频中,黄仁勋表示,从Xavier开始,英伟达就创造了一种新的处理器,也就是机器人处理器,当时没人知道他们在做什么。

黄仁勋表示,Jetson Orin Nano Super非常适合那些希望在生成式AI、机器人技术或计算机视觉领域发展技能的人士。在AI领域从任务专用模型向基础模型转变的趋势下,它也为开发者提供了一个将创意变为现实的易用平台。

Jetson Orin Nano Super性能增强,为所有流行的生成式AI模型,例如Meta的LLaMA、阿里巴巴的通义千问以及谷歌的Gemma。这款套件基于Transformer的计算机视觉模型带来了显著提升,进一步提升效能表现。

英伟达强调,随着AI技术逐渐从云端走向终端,实体AI将是下一波发展重点,Jetson Orin Nano Super不仅可以用于开发聊天机器人,也适合简历视觉AI代理或部署AI机器人等应用。

英伟达也宣布将为Jetson Orin NX和Nano系列的系统模块提供软件更新,让它们也能享受到Super模式的性能提升,最高可达70%。这些更新将通过Jetpack SDK管理器发布在英伟达网站和GitHub上。

每日经济新闻综合公开资料

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
深度科普:阴茎骨是灵长物种标配,最长超半米,人类为何失去它?

深度科普:阴茎骨是灵长物种标配,最长超半米,人类为何失去它?

宇宙时空
2026-05-20 17:00:12
4-2背后藏着多少内斗?姆巴佩破门,贝林厄姆建功,皇马拿了胜利却输掉了未来

4-2背后藏着多少内斗?姆巴佩破门,贝林厄姆建功,皇马拿了胜利却输掉了未来

林子说事
2026-05-24 08:19:30
朱玲玲和现任丈夫佛山逛市集,罗康瑞全程满面笑容陪伴,非常宠妻

朱玲玲和现任丈夫佛山逛市集,罗康瑞全程满面笑容陪伴,非常宠妻

可乐谈情感
2026-05-24 08:16:00
到底谁在传重庆月薪3000?网友:都是谣言,哪有3000,都是2000多

到底谁在传重庆月薪3000?网友:都是谣言,哪有3000,都是2000多

另子维爱读史
2026-05-17 12:10:34
中美日激光武器射程差距太大:美8000米、日1200米,中国是多少?

中美日激光武器射程差距太大:美8000米、日1200米,中国是多少?

别吵吵
2026-05-24 08:51:56
别再被隋唐演义误导,正史中公认武力值最高的,是这五位顶尖猛将

别再被隋唐演义误导,正史中公认武力值最高的,是这五位顶尖猛将

长风文史
2026-05-21 17:01:36
暗流涌动!俄罗斯警告,一大批西方武器装备,在中国周边急速扩张

暗流涌动!俄罗斯警告,一大批西方武器装备,在中国周边急速扩张

阿柒的讯
2026-05-24 12:43:13
秦海璐问刘浩存:下次我找你拍戏,零片酬行吗?刘浩存回应显情商

秦海璐问刘浩存:下次我找你拍戏,零片酬行吗?刘浩存回应显情商

娱最资讯
2026-05-24 10:04:08
48:43!美国投票结果出来了,日本逮捕美士兵,特朗普支持率公布

48:43!美国投票结果出来了,日本逮捕美士兵,特朗普支持率公布

浪子阿邴聊体育
2026-05-24 10:45:00
陈慧琳49岁弟弟陈司翰罕露脸,中年发福气质仍儒雅,至今仍未婚育

陈慧琳49岁弟弟陈司翰罕露脸,中年发福气质仍儒雅,至今仍未婚育

八斗小先生
2026-05-23 11:08:44
耻辱!皇马水货惨遭除名!穆里尼奥 2500 万砸世界级王牌取代他!

耻辱!皇马水货惨遭除名!穆里尼奥 2500 万砸世界级王牌取代他!

澜归序
2026-05-24 03:49:00
看来真准备动手了?台惊呼大陆直升机密密麻麻,这次真不一样了!

看来真准备动手了?台惊呼大陆直升机密密麻麻,这次真不一样了!

安安说
2026-05-23 12:43:00
高盛:沪电股份最新调研,PCB进入量价齐升的高景气周期

高盛:沪电股份最新调研,PCB进入量价齐升的高景气周期

新浪财经
2026-05-24 14:11:59
1688是中国互联网最大的灯下黑

1688是中国互联网最大的灯下黑

流苏晚晴
2026-05-23 19:52:27
新任安徽省副省长何淳宽分工公布

新任安徽省副省长何淳宽分工公布

上观新闻
2026-05-24 14:51:05
叙利亚,为什么没人再提了?

叙利亚,为什么没人再提了?

民间胡扯老哥
2026-05-22 06:48:12
深圳球迷意难平!不止因为88-97不敌广厦,更多在于以下这五点!

深圳球迷意难平!不止因为88-97不敌广厦,更多在于以下这五点!

田先生篮球
2026-05-23 22:23:23
最后关头,特朗普变卦没有签字,中方已收到消息,美国不想当老二

最后关头,特朗普变卦没有签字,中方已收到消息,美国不想当老二

黑鹰观军事
2026-05-24 01:16:17
SpaceX新火箭首飞:发动机没全亮,但马斯克说"为人类进了一球"

SpaceX新火箭首飞:发动机没全亮,但马斯克说"为人类进了一球"

历史的尘埃发
2026-05-23 09:00:52
赛季最佳爆冷!C罗无缘沙特联赛大奖,昔日切尔西失意球星登顶

赛季最佳爆冷!C罗无缘沙特联赛大奖,昔日切尔西失意球星登顶

夜白侃球
2026-05-24 10:18:13
2026-05-24 15:16:49
每日经济新闻 incentive-icons
每日经济新闻
中国主流财经全媒体平台。
1578444文章数 2726209关注度
往期回顾 全部

科技要闻

我戴着摄像头上班,正在帮AI抢走我饭碗

头条要闻

男子不慎踩中蛇窝一小时后陷入休克:左脚被咬10多口

头条要闻

男子不慎踩中蛇窝一小时后陷入休克:左脚被咬10多口

体育要闻

唐斯发牌,大头逆袭:骑士跌向残忍夏季

娱乐要闻

李晨郑恺冲上热搜!跑男停宣引热议

财经要闻

爆炸致82人遇难 留神峪煤业存违法行为

汽车要闻

2027款星途瑶光上市 把"全球车"标准卷进13万级市场

态度原创

房产
本地
手机
家居
公开课

房产要闻

疯狂周末,海口楼市突然爆了!

本地新闻

用云锦的方式,打开江苏南京

手机要闻

拉美Q1:三星第一,小米第二,荣耀大亮

家居要闻

低调传承 温润沉静

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版