网易首页 > 网易号 > 正文 申请入驻

训练成本不到50美元,研究人员打造出媲美 OpenAI o1 的推理模型

0
分享至

IT之家 2 月 6 日消息,一份上周五发布的研究报告显示,斯坦福大学和华盛顿大学的人工智能研究人员仅花费不到 50 美元(IT之家备注:当前约 364 元人民币)的云计算费用,就成功训练出一个具备“推理”能力的人工智能模型。

该模型名为 s1,在数学和编程能力测试中表现出与 OpenAI 的 o1 和 DeepSeek 的 r1 等顶尖推理模型相似的水平。目前,s1 模型及其训练所用的数据和代码已在 GitHub 上开源。

s1 团队表示,他们通过“蒸馏”技术创建了该人工智能模型,该技术旨在通过训练模型来学习另一个人工智能模型的答案,从而提取其“推理”能力。研究人员透露,s1 是从谷歌的推理模型 Gemini 2.0 Flash Thinking Experimental 中蒸馏出来的。上个月,加州大学伯克利分校的研究人员也使用了相同的蒸馏方法,以约 450 美元的成本创建了一个人工智能推理模型。

类似 s1 模型的出现也引发了关于人工智能模型商品化的问题 —— 如果有人可以用相对较低的成本就能复制一个价值数百万美元的模型,那么大型科技公司的“护城河”在哪里呢?

不出所料,大型人工智能实验室对此并不满意,例如 OpenAI 此前就指责 DeepSeek 不当获取其 API 数据用于模型蒸馏。

s1 的研究人员希望找到实现强大推理性能和“测试时扩展”(即允许人工智能模型在回答问题之前进行更多思考)的最简单方法,这些是 OpenAI 的 o1 中的一些突破。

s1 的论文表明,可以使用一种称为监督微调(SFT)的方法,可以使用相对较小的数据集来蒸馏推理模型。在 SFT 中,人工智能模型会被明确指示在数据集中模仿某些行为。SFT 比 DeepSeek 用于训练其 R1 模型的大规模强化学习方法更具成本效益。

谷歌通过其 Google AI Studio 平台免费提供 Gemini 2.0 Flash Thinking Experimental 模型的访问权限,但每天有使用限制。然而,其条款禁止对模型进行逆向工程,以开发与谷歌自身人工智能产品竞争的服务。

S1 基于阿里巴巴旗下中国人工智能实验室 Qwen 提供的一款小型、现成的免费人工智能模型。为了训练 s1,研究人员创建了一个仅包含 1000 个精心策划的问题的数据集,以及这些问题的答案,以及谷歌 Gemini 2.0 Flash Thinking Experimental 给出的每个答案背后的“思考”过程。

研究人员表示,在训练 s1 后(使用 16 个 Nvidia H100 GPU,耗时不到 30 分钟),s1 在某些人工智能基准测试中取得了良好的表现。参与该项目的斯坦福大学研究员 Niklas Muennighoff 告诉 TechCrunch,目前租用这些计算资源的成本约为 20 美元。

研究人员使用了一个巧妙的技巧来让 s1 检查其工作并延长其“思考”时间:他们让它“等待”。论文显示,在 s1 的推理过程中添加“等待”一词,有助于模型获得稍微更准确的答案。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
原来没房贷车贷的加持可以这么可怕!网友:难怪领导一直催我结婚

原来没房贷车贷的加持可以这么可怕!网友:难怪领导一直催我结婚

三农老历
2026-05-26 12:49:09
莱斯特城消亡史:从蓝狐神话到三级联赛,短短十年满目疮痍

莱斯特城消亡史:从蓝狐神话到三级联赛,短短十年满目疮痍

夜白侃球
2026-04-22 10:55:15
妻子惨死家中,丈夫被判死缓,19年洗清沉冤,真凶已是三级警督!

妻子惨死家中,丈夫被判死缓,19年洗清沉冤,真凶已是三级警督!

易玄
2026-05-25 20:07:32
5月27日精选热点:光纤史诗级采集来了,这些龙头要大涨

5月27日精选热点:光纤史诗级采集来了,这些龙头要大涨

元芳说投资
2026-05-26 21:19:16
保安用手接下跳楼女孩,被砸瘫痪无钱救治,女孩家属:你多管闲事

保安用手接下跳楼女孩,被砸瘫痪无钱救治,女孩家属:你多管闲事

莫地方
2026-05-25 01:05:03
郑钦文泪洒发布会:这是一场沉重的失利,考虑从低级别赛事打起

郑钦文泪洒发布会:这是一场沉重的失利,考虑从低级别赛事打起

全景体育V
2026-05-25 21:39:23
苏州一男子吃完面加6勺辣椒酱被店主曝光,店主回应:气愤,曝光的本意是希望不要浪费;律师:属于故意浪费,店家有权主张赔偿

苏州一男子吃完面加6勺辣椒酱被店主曝光,店主回应:气愤,曝光的本意是希望不要浪费;律师:属于故意浪费,店家有权主张赔偿

大风新闻
2026-05-26 18:19:35
没把大陆的劝诫听进去,郑丽文踏上赴美飞机前,卢秀燕撕下了伪装

没把大陆的劝诫听进去,郑丽文踏上赴美飞机前,卢秀燕撕下了伪装

阿天爱旅行
2026-05-26 21:23:04
流浪猫被绝育后黑化,天天冲进诊所打顾客,医院无奈贴告示

流浪猫被绝育后黑化,天天冲进诊所打顾客,医院无奈贴告示

Magic宠物社
2026-05-25 19:35:06
首个退群北约的国家来了:已走程序,退意已决!

首个退群北约的国家来了:已走程序,退意已决!

福建睿平
2026-04-27 11:46:08
炸锅!深圳首个“超大城中村旧改”重磅落地,多个城中村旧改提速?

炸锅!深圳首个“超大城中村旧改”重磅落地,多个城中村旧改提速?

新浪财经
2026-05-26 02:07:07
鲁比奥在印度彻底“服了”,该国有个大难题,使之无法成为中国

鲁比奥在印度彻底“服了”,该国有个大难题,使之无法成为中国

近史谈
2026-05-26 20:04:57
几内亚打出“资源牌”?储量占世界1/3的铝土矿,6月将出口管制

几内亚打出“资源牌”?储量占世界1/3的铝土矿,6月将出口管制

全城探秘
2026-05-26 11:45:24
警惕“养卡代还”陷阱!藏在出租屋里的52亿“养卡帝国”被警方捣毁|封面深镜

警惕“养卡代还”陷阱!藏在出租屋里的52亿“养卡帝国”被警方捣毁|封面深镜

封面新闻
2026-05-26 14:24:02
鸭蛋被关注!研究发现:吃得越多,肌少症老年人肌肉流失或越慢?

鸭蛋被关注!研究发现:吃得越多,肌少症老年人肌肉流失或越慢?

健康科普365
2026-05-26 20:30:07
【完整版】米切尔:詹姆斯来不来跟我无关 我和哈登都想登上巅峰!

【完整版】米切尔:詹姆斯来不来跟我无关 我和哈登都想登上巅峰!

天光破云来
2026-05-26 13:06:36
经纪人谈温岚病情:因结石引发败血症,经ICU抢救10天,已转至一般病房

经纪人谈温岚病情:因结石引发败血症,经ICU抢救10天,已转至一般病房

红星新闻
2026-05-26 13:38:13
峰回路转?曼城亿元先生原本被弃用 新帅上任后有望留队证明自己

峰回路转?曼城亿元先生原本被弃用 新帅上任后有望留队证明自己

雪狼侃体育
2026-05-26 22:27:59
请做好准备,要变天了!

请做好准备,要变天了!

喽哥
2026-05-24 20:03:14
48岁海清出席活动,穿低胸吊带脸上皱巴,网友:不能体面老去吗?

48岁海清出席活动,穿低胸吊带脸上皱巴,网友:不能体面老去吗?

阿库财经
2026-04-24 23:49:57
2026-05-26 23:04:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
346299文章数 607222关注度
往期回顾 全部

科技要闻

中国AI要向外卷,而不只是做第二个OpenAI

头条要闻

留神峪煤矿"暗面"矿工发声:遇检查时矿上就提前封堵

头条要闻

留神峪煤矿"暗面"矿工发声:遇检查时矿上就提前封堵

体育要闻

上赛季差点降入英甲,下赛季要踢英超了

娱乐要闻

台媒贴脸!S妈被问大S嗑药当场沉默

财经要闻

中国铝行业爆单 下一个“煤炭”大周期?

汽车要闻

涉水加强 福特烈马亚马逊限量版上市 售价39.98万

态度原创

本地
健康
亲子
艺术
旅游

本地新闻

用云锦的方式,打开江苏南京

外泌体抗衰,什么时候能用上?

亲子要闻

孩子咳嗽气管炎,可以选择这几个穴位针灸治疗

艺术要闻

中国之美,美到极致!

旅游要闻

句容一景区通知:暂停开放

无障碍浏览 进入关怀版