网易首页 > 网易号 > 正文 申请入驻

OpenAI推出全新GPT-4o mini免费上线,2年内GPT大模型成本骤降99%|钛媒体AGI

0
分享至


(图片来源:unsplash)

就在刚刚,ChatGPT再度上新。

北京时间7月19日凌晨,美国OpenAI公司推出一款新的 AI 模型“GPT-4o mini”,即GPT-4o的更小参数量、简化版本。

OpenAI表示,GPT-4o mini是目前功能最强大、性价比最高的小参数模型,性能逼近原版GPT-4,成本相比GPT-3.5 Turbo便宜60%以上,支持50种不同语言,替代GPT-3.5版本的ChatGPT,但该公司没有透露其训练参数规模信息。


OpenAI表示,API层面,GPT-4o mini支持128k、16k输入tokens(图像和文本);价格层面,GPT-4o mini每百万输入tokens为15美分(约1.09元人民币),每百万输出tokens为60美分(约4.36元)。

按照规划,GPT-4o mini即日起向ChatGPT免费用户以及 ChatGPT Plus和Team付费订阅用户开放,并将于下周向ChatGPT Enterprise企业版客户开放。另外,未来几天内,OpenAI还将开放GPT-4o mini微调版本。

“推动我们可以免费提供 AI 技术的极限,是确保 AGI 造福全人类追求的一部分。”ChatGPT官方账号在社交平台上表示。

OpenAI CEO奥尔特曼(Sam Altman)还透露,仅仅两年前,世界上最好的模型还是GPT-3的text-davinci-003版本,与今天相比表现差得多,还要贵上100倍。

换句话来说,短短两年,GPT大模型每token的成本价格已经下降99%。


实际上,早在今年5月14日,OpenAI推出可免费使用的全新旗舰AI模型GPT-4o。

OpenAI首席技术官米拉·穆拉蒂 (Mira Murati)表示,GPT-4o里的“o”是Omni(全能模型)的缩写,可实时进行音频、视觉和文本推理,它可以在短至232毫秒、平均320毫秒的时间内响应音频输入,与人类在对话中的反应速度一致。

米拉·穆拉蒂指出,在API使用方面,相比去年11月发布的GPT-4-turbo,GPT-4o价格降低一半(50%),速度提升两倍(200%)。

OpenAI CEO奥尔特曼(Sam Altman)当时称,新的GPT-4o是OpenAI有史以来最好的模型,它很智能,速度很快,是原生多模态,并且GPT-4o语音助手可供包括Plus、免费版本在内的所有ChatGPT用户使用。

然而,GPT-4o语音助手却意外地迎来推迟。今年6月22日,OpenAI宣布,原计划在6月下旬向一小群 ChatGPT Plus用户推出的GPT-4o语音功能,将推迟到7月,还需要一个月时间才能达到发布标准。至于原因,OpenAI称是因为需要更多时间进行安全测试。

“我们正在提高模型检测和拒绝某些内容的能力,同时努力改善用户体验,并准备我们的基础设施扩展到数百万,同时保持实时响应。”OpenAI表示。


如今,OpenAI似乎又重新调整,推出了小参数模型GPT-4o mini。而一般来说,这类小参数模型规模大约不到7B(70亿),可用于笔记本电脑、手机等端侧设备。

具体来说,GPT-4o mini 在文本智能和多模态推理方面的学术基准测试中超越了 GPT-3.5 Turbo 和其他小型模型,并且支持的语言范围与 GPT-4o 相同。它还在函数调用方面表现出色,这可以使开发人员构建获取数据或使用外部系统采取行动的应用程序,并且与 GPT-3.5 Turbo 相比,它的长上下文性能有所提高。

  • 推理任务: GPT-4o mini 在涉及文本和视觉的推理任务上优于其他小型模型,在文本智能和推理基准 MMLU 上的得分为 82.0%,而 Gemini Flash 为 77.9%,Claude Haiku 为 73.8%。
  • 数学和编码能力: GPT-4o mini 在数学推理和编码任务中表现出色,优于市场上之前的小型模型。在测量数学推理的 MGSM 上,GPT-4o mini 得分为 87.0%,而 Gemini Flash 得分为 75.5%,Claude Haiku 得分为 71.7%。在测量编码性能的 HumanEval 上,GPT-4o mini 得分为 87.2%,而 Gemini Flash 得分为 71.5%,Claude Haiku 得分为 75.9%。
  • 多模态推理: GPT-4o mini 在多模态推理评估 MMMU 上也表现出色,得分为 59.4%,而 Gemini Flash 为 56.1%,Claude Haiku 为 50.2%。


性价比方面,GPT-4o mini发挥优异。目前,GPT-4o mini 现已作为文本和视觉模型在 Assistants API、Chat Completions API 和 Batch API 中提供。开发人员每 100 万个输入令牌支付 15 美分,每 100 万个输出令牌支付 60 美分(大约相当于标准书籍的 2500 页)。

OpenAI表示,这比之前的 Frontier 型号便宜一个数量级,比 GPT-3.5 Turbo 便宜 60% 以上。


OpenAI API 产品负责人 Olivier Godement 表示:“我们的使命是推动前沿技术的发展,打造最强大、最实用的应用程序,我们当然希望继续开发前沿模型,不断突破极限。但我们也希望拥有最好的小型模型。”

Godement表示,过去一周,一些开发人员一直在试用GPT-4o mini。一家美国电邮初创公司Superhuman使用它来制作消息的自动回复,金融服务初创公司Ramp依靠它从收据中提取信息。

不过,很遗憾的是,目前从测试来看,GPT-4o mini并未解决9.11和9.9谁的数值大这个问题。

另外,OpenAI还表示,GPT-4o mini 是该公司首个使用其开发的新安全策略(称为“指令层次结构”)的 AI 模型。这种方法的目的是让 AI 系统优先执行某些指令(例如来自公司的指令),从而使人们更难让该工具做不该做的事情。

实际上,当前,GPT-4o mini同性能下的小端侧模型赛道,估值800亿美金的OpenAI将面临着诸多竞争对手。

其中,包括 Anthropic、谷歌等多个涉足于 AI 模型的公司,经常发布其最先进模型的更灵活、功能更少、成本更低的版本,比如Gemma-7B,以便为开发人员提供更多选择。而较小的模型可能在算力成本低的情况下实现最适合的基本任务,而较大的模型可能可以处理更复杂的任务。

值得一提的是,就在今年7月,仅有8人的法国AI实验室kyutai发布首个实时原生多模态Moshi,仅用了半年的时间从头训练,效果演示堪比5月发布的GPT-4o,被誉为“开源版”GPT-4o。

同在7月19日凌晨,Mistral Al发布12B的小模型,同英伟达合作开发,上下文长度为128K,迎来对战。

而在国内,商汤早前发布国内首个所见即所得、实时流式多模态交互模型“日日新5o”,交互体验对标GPT-4o;科大讯飞董事长刘庆峰直言,讯飞星火大模型的语音效果也堪比GPT-4o。另外,7月16日左右,阿里云Qwen也公布了类似于GPT-4o的语音助手技术。

因此,接下来,GPT-4o mini将面临市场上诸多竞争对手的局面。

但可以确定的是,随着苹果、微软、Arm、英特尔、高通等诸多终端产业链龙头的加入,这类小端侧模型或将成为2024年最热门的大模型赛道之一。

爱芯元智创始人、董事长仇肖莘对钛媒体App表示,端侧AI大模型应用是一个巨大的机遇机会。大模型在端侧落地的场景首先可能是车,随后是手机、AI PC等。目前,大模型的落地现在还处于非常原始的阶段——broke force(乱局)。

“应用场景非常多样。一个3.2T的小芯片,如果集成到手机芯片里,手机就可以在本地完成很多应用的运行,而无需上云。”仇肖莘表示,生成式 AI 的底座大模型一定是在云端,但大模型是不是能够通过微调,或者某些优化等方式,形成行业大模型,落到边缘侧,而非这种几万亿的参数量,还是有可能的。

CNBC评价称,GPT-4o mini是OpenAI 努力走在“多模态”前沿技术的一部分,即在一个工具 ChatGPT 中提供多种媒介类型(如文本、图像、音频和视频)下的生成式 AI 技术能力。

中国企业家杂志提到,目前国内已有一部分大模型公司放弃了底层模型的更新探索包括投喂更多数据和尝试新算法,转向应用和场景探索。技术进化不重要,赚钱才是正经事。

清华大学计算机系长聘副教授,面壁智能联合创始人、首席科学家刘知远强调,未来的 AI 大模型将是端云协同的模式。出于隐私保护、算力等考虑,把模型放在离用户更近的地方,具有重要的价值和意义。

(本文首发于钛媒体App,作者|林志佳,编辑|胡润峰)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
女子酒店看电视被隔壁投屏色情片,津津有味看了10分钟,本人回应

女子酒店看电视被隔壁投屏色情片,津津有味看了10分钟,本人回应

180°视角
2024-10-31 10:48:41
赵露思宣传新剧“矮”上热搜!网友:身高太灾难!队伍都凹进去了

赵露思宣传新剧“矮”上热搜!网友:身高太灾难!队伍都凹进去了

小娱乐悠悠
2024-10-31 10:03:38
南昌工学院22岁女生被19岁男友捅死,知情者发声:女生骗钱骗感情

南昌工学院22岁女生被19岁男友捅死,知情者发声:女生骗钱骗感情

180°视角
2024-10-31 11:58:09
成都上演老实人的愤怒了

成都上演老实人的愤怒了

清晖有墨
2024-10-30 20:36:10
中方:坚决反对,绝不接受!

中方:坚决反对,绝不接受!

新京报
2024-10-31 08:16:07
现在是10月30号下午,刚刚曝出1个惊天大消息,要来大动作了吗?

现在是10月30号下午,刚刚曝出1个惊天大消息,要来大动作了吗?

股市皆大事
2024-10-30 14:02:49
河南一男子投资千万建厂遭遇办证难 状告市监局胜诉后仍未拿到证

河南一男子投资千万建厂遭遇办证难 状告市监局胜诉后仍未拿到证

极目新闻
2024-10-31 09:31:03
“特朗普明说了:明年1月我重返白宫前,你必须…”

“特朗普明说了:明年1月我重返白宫前,你必须…”

观察者网
2024-10-31 08:58:13
七个摇摆州全部翻红,特朗普亮出底牌,美国大选几乎“无悬念”了

七个摇摆州全部翻红,特朗普亮出底牌,美国大选几乎“无悬念”了

阿纂看事
2024-10-31 09:00:52
狗血!婚前几天新郎约人开房,超美新娘愤而拒婚!毁三观现场曝光

狗血!婚前几天新郎约人开房,超美新娘愤而拒婚!毁三观现场曝光

新动察plus
2024-10-31 13:51:25
一桩举报背后的情与法:拿到200万“分手补偿款”后,90后女孩因敲诈勒索被判十年

一桩举报背后的情与法:拿到200万“分手补偿款”后,90后女孩因敲诈勒索被判十年

红星新闻
2024-10-31 00:40:52
上海街头突发!电瓶车与大巴猛烈相撞,飞出数米远,骑车人受伤倒地,无法动弹

上海街头突发!电瓶车与大巴猛烈相撞,飞出数米远,骑车人受伤倒地,无法动弹

上观新闻
2024-10-31 14:32:32
重点关注:明年1月起我国取消病退政策

重点关注:明年1月起我国取消病退政策

古今历史记
2024-10-31 10:01:11
上海发布台风蓝色预警,周五是否停学?教委正在研判

上海发布台风蓝色预警,周五是否停学?教委正在研判

澎湃新闻
2024-10-31 09:36:26
好友曝顾国宁去世细节:发现已是肺癌晚期,生前爱喝酒吸烟

好友曝顾国宁去世细节:发现已是肺癌晚期,生前爱喝酒吸烟

180°视角
2024-10-29 16:51:45
臭肉事件再曝大雷:98%学生被查出尿酸超标,家长维权遭多方打压

臭肉事件再曝大雷:98%学生被查出尿酸超标,家长维权遭多方打压

兵叔评说
2024-10-31 00:11:02
国防部:几件美制武器无法改变两岸军事力量对比态势

国防部:几件美制武器无法改变两岸军事力量对比态势

财联社
2024-10-31 15:21:07
突发!不干了,整整7年啊,姚明正式辞职,中国篮球何去何从?

突发!不干了,整整7年啊,姚明正式辞职,中国篮球何去何从?

球童无忌
2024-10-30 16:46:09
河北保定4名女学生称就餐时拒绝搭讪被殴,教育局:正在核实

河北保定4名女学生称就餐时拒绝搭讪被殴,教育局:正在核实

极目新闻
2024-10-31 11:50:06
库里伤停勇士背靠背双杀鹈鹕 希尔德21分锡安20中5

库里伤停勇士背靠背双杀鹈鹕 希尔德21分锡安20中5

醉卧浮生
2024-10-31 12:31:49
2024-10-31 15:34:44
钛媒体APP
钛媒体APP
独立财经科技媒体
109368文章数 859242关注度
往期回顾 全部

科技要闻

任正非:华为要向美国学习开放、包容

头条要闻

客流断崖式下跌 上海设99个站点最长公交营收不够油费

头条要闻

客流断崖式下跌 上海设99个站点最长公交营收不够油费

体育要闻

换帅后首战!曼联5-2赢了 进英联杯8强

娱乐要闻

刘大锤曝两对明星偷偷领证结婚

财经要闻

减持!李嘉诚又出手了

汽车要闻

宋PLUS有对手啦?15万插电混动SUV又一新选择

态度原创

游戏
家居
本地
公开课
军事航空

反对到底!推主在《龙腾4》Steam加"检测到DEI"标签

家居要闻

回归自然 去繁求简开阔空间

本地新闻

云游中国|一字独天下,一城秀江南

公开课

AI如何揭开大自然和宇宙的奥秘

军事要闻

朝鲜宣布试射洲际弹道导弹 金正恩现场观看

无障碍浏览 进入关怀版