网易首页 > 网易号 > 正文 申请入驻

Anthropic CEO:大模型训练成本暴涨,2027年将达1000亿美元!

0
分享至


新智元报道

编辑:耳朵 庸庸

【新智元导读】Anthropic首席执行官表示,当前AI模型训练成本是10亿美元,未来三年,这个数字可能会上升到100亿美元甚至1000亿美元。要知道,GPT-4o这个曾经最大的模型也只用了1亿美元。千亿美刀,究竟花在了哪里?

AI行业巨大的收支鸿沟近日引起了广泛讨论,仅仅按照现在的训练成本计算,已经达到了5000亿美元的天文数字,许多人都在担忧AI泡沫被戳破之后,有可能会导致新的经济危机。

目前来看,能够商业化落地并实现大额盈利的「巨物」还未诞生,但是AI训练的成本却还在攀升,并且会逐年呈指数级增长。

Anthropic首席执行官Dario Amodei在In Good Company播客节目中表示,目前正在开发的人工智能模型的训练成本高达10亿美元。

GPT-4o已经成为了历史,因为像它这样的模型「仅」需花费约1亿美元,跟现在正在开发的模型相比,可谓是小巫见大巫了。

Dario Amodei预计,从现在开始,短短三年内,AI模型的训练成本将上升到100亿美元甚至1000亿美元。


Dario Amodei,OpenAI前研究副总裁,2021年创立Claude大模型母公司Anthropic

预测来自于Amodei在讨论AI如何从生成式人工智能(GenAI)发展到通用人工智能(AGI)时的一段分析。

他说,「我们不会在某一点上突然达到 AGI,这将是一个循序渐进的发展过程,模型建立在过去模型发展的基础上,就像人类儿童的学习方式一样」。

如果人工智能模型每年强大十倍,我们可以合理地预期训练它们所需的硬件也至少强大十倍。

因此,硬件可能是人工智能训练中最大的成本驱动因素。「卖铲子」的英伟达又要赚得盆满钵满了。

早在2023年,就有报道称ChatGPT将需要超过30000个GPU,Sam Altman证实GPT-4的训练成本为1亿美元。


去年,超过380万个GPU交付给数据中心。鉴于英伟达最新的B200 AI芯片的成本约为 30000-40000 美元,两个数字相乘,我们就能明白Dario所言非虚——2024年AI训练成本已经高达10亿美元。

如果模型继续以当前的指数速度增长,那硬件资源也得跟上,缺口会越来越大,除非像Sohu人工智能芯片这样更高效的技术变得更加普遍。


我们已经可以看到这种指数级增长的发生。

埃隆·马斯克计划采购30万个B200 AI芯片,据报道OpenAI和微软正在计划建造一个价值1000亿美元的 AI 数据中心。

考虑到所有这些需求,如果英伟达和其他供应商能够跟上市场的步伐,明年GPU数据中心的交付量将激增至3800万个,是去年的10倍!

芯片硬件不是唯一掣肘的因素,电力和相关基础设施也是重要的成本损耗之一。

据估计,去年售出的所有数据中心GPU的总耗电量可为130万户家庭供电。

如果数据中心的电力需求继续呈指数级增长,那么当前足够的价格经济的电力将会被消耗殆尽。

此外,这些数据中心不仅需要发电厂,它们还需要一个完全升级的电网,以处理耗电量巨大的人工智能芯片运行所需的所有电子。

因此,包括微软在内的许多科技公司现在都在考虑为其数据中心采用模块化核电,微软正在寻找一位关键人物来领导其核技术战略,重点是为其数据中心实施小型模块化反应堆 (SMR) 和微反应堆。


那么,3年之内,AI训练成本真的会达到Anthropic所预测的1000亿美元吗?有没有更多的证据支撑呢?我们一起来算笔账看看——

1000亿美元怎么花?

根据斯坦福大学《人工智能指数数据报告2024》显示,AI模型的训练成本呈现飞速增长,短短几年间从四位数跃升至九位数。

例如,2017年训练最初的Transformer模型的成本仅为约900美元,而到了2019年,RoBERTa Large模型的训练成本已经升至约160000美元。

到了2023年,OpenAI的GPT-4和Google的Gemini Ultra的训练成本更是分别达到了约7800万美元和近2亿美元。


报告指出,随着AI模型参数数量的激增,其训练所需的算力和能耗也随之水涨船高。

大参数模型通常意味着更高的训练成本,因为它们需要更强大的硬件设施、更长的训练时间以及更大的数据集来支撑。

这种关联性在报告中通过图表清晰地显示出参数数量与训练成本之间成正比例关系,参数越大,训练成本越高。


2亿已经数额颇为惊人了,那么十个指头都数不过来的千亿美刀会怎么花?

首先大头必定花在硬件成本上。

主要包括购置和维护高性能计算设备(如GPU、TPU、CPU集群等)的费用。这些设备是执行大量计算以训练大规模模型所必需的。

硬件成本占比较高,尤其是在需要大规模并行计算和高吞吐量存储的情况下。

前几天马斯克刚透露花40亿美元购买10万张H100训练Grok 3,这会儿Amodei预言千亿训练模型,老黄屏幕背后微微一笑,又可以靠卖铲子买新皮衣了!


reddit网友也指出,千亿美元一大半要被老黄赚走。


黄仁勋:(兴奋地搓手手)


老黄家GPU产生的热量,把亿万资金烧的付之一炬。

也有网友打趣到,不管是GPU烧的热量还是未来百亿大单让人想想就红温,皮衣战神可以脱下他的经典皮肤散散热。


其次成本的重头还在于能源消耗。

有数据显示,全美AI数据中心的耗电量占全美总用电量的2.5%,足以点亮整个纽约市。

GPT-3的训练约消耗1300兆瓦时电力,如果连续播放视频可持续播放约186年。

由此可见,AI模型训练是一个高度能源密集的过程,涉及到大量的计算操作和数据交换。

数据中心的电力消耗、冷却设施运行以及潜在的碳排放成本构成了能源成本。随着对可持续性和碳中和目标的关注增加,这部分成本的重要性愈发凸显。

奥特曼曾经就表示,AGI的尽头可能是能源问题,核聚变或是AI能源战的最终方案。


微软已经表示,他们正在考虑建造一座价值1000亿美元的设施,其中最令人震惊的是对电力的投入。


首先需要解决能源问题,否则就不会有 AGl。大脑使用约20瓦特的功率,而粗放的使用方法消耗的功率相当于一个国家的使用量。

第三是人力资源的支出。

训练AI模型需要一支专业的工程师和科学家团队,包括数据工程师、AI研究员、软件工程师等。他们的薪资、福利、培训和发展成本构成了人力资源成本。

AI人才也是AI军备竞赛中一个不可忽视的兵家必争之地。大佬们纷纷开百万年薪,亲自发邮件挖人,亲自打电话留人等等,只为获得AI人才青睐。

第四就是数据成本的花销,高质量、大规模的训练数据对于AI模型的性能至关重要。


数据采集、标注、清洗、存储和传输等环节会产生相应的成本,包括人力、工具、平台使用费等。

对于某些特定领域的数据(如医疗影像、金融交易数据),数据获取可能涉及购买许可证、支付版权费等额外支出。

例如,Scale AI CEO就开出时薪40美元招聘高学历博士训练AI数据标注,只为获得专业性强的高质量数据。

最后要考虑运行维护和管理成本。

包括数据中心运维、网络带宽、安全防护、故障恢复、备份系统等的建设和维护费用。

随着模型规模的扩大和模型复杂度的提升,对基础设施的稳定性和可靠性要求更高。

其中,硬件成本和能源消耗占比较大,特别是在训练超大规模模型时,这两部分成本可能会占到总成本的大头。

随着AI技术的发展和应用规模的扩大,能源消耗问题的解决迫在眉睫。许多研究和实践已经开始探讨如何通过优化算法、提高硬件能效、采用可再生能源、采用液冷系统等方式降低AI训练的能源成本。

总体来说,资金在未来大规模流向AI领域早就可以预见,不过也有人怀疑如此大规模的千亿巨单钱从哪儿来?投入产出比又会如何?

虽说AI被类比为人类儿童的学习方式,但它可比「训练」人类小孩花费多得多,网友在投入产出比这块儿调侃道「请训练我好不好」。


谁在我身上花一千亿我搞不好也能达到一样的目标,训的比大多数人厉害呢。

参考资料:

https://www.tomshardware.com/tech-industry/artificial-intelligence/ai-models-that-cost-dollar1-billion-to-train-are-in-development-dollar100-billion-models-coming-soon-largest-current-models-take-only-dollar100-million-to-train-anthropic-ceo

https://www.reddit.com/r/technology/comments/1dxkyt5/ai_models_that_cost_1_billion_to_train_are/



特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
各种疾病的早期信号,太全了!

各种疾病的早期信号,太全了!

今日养生之道
2024-09-07 15:42:35
两国合作研制雾化的超级病毒“新冠+猴痘+艾滋”

两国合作研制雾化的超级病毒“新冠+猴痘+艾滋”

老佛爷Wu
2024-09-07 09:15:51
新经济视界 | 中国制造的“口袋太阳”出海,在非洲“消灭蜡烛”

新经济视界 | 中国制造的“口袋太阳”出海,在非洲“消灭蜡烛”

封面新闻
2024-09-05 14:56:23
起风了:骑行类似案件直接撤案!网友沸腾,这次稳了吧?

起风了:骑行类似案件直接撤案!网友沸腾,这次稳了吧?

眼光很亮
2024-09-07 16:18:20
上海孤老立遗嘱:30万存款留给老同学!不料同学取钱时,银行却拒绝支付

上海孤老立遗嘱:30万存款留给老同学!不料同学取钱时,银行却拒绝支付

鲁中晨报
2024-09-07 11:13:03
快讯!广东一副市长被查

快讯!广东一副市长被查

中安在线
2024-09-08 09:56:09
孙卓已到南京工业大学报到,称学校绿化特别好,还透露“喜欢江南”

孙卓已到南京工业大学报到,称学校绿化特别好,还透露“喜欢江南”

极目新闻
2024-09-07 13:44:37
卡梅隆毁了最伟大的科幻片

卡梅隆毁了最伟大的科幻片

虹膜
2024-09-07 20:35:46
篮网老板蔡崇信一盆冷水,让NBA头号诈骗犯西蒙斯傻眼了

篮网老板蔡崇信一盆冷水,让NBA头号诈骗犯西蒙斯傻眼了

大眼瞄世界
2024-09-08 00:21:46
球球爸爸不要赔偿,就要司机抵命:其实他没有认识到错的是他自己

球球爸爸不要赔偿,就要司机抵命:其实他没有认识到错的是他自己

大道微言
2024-09-07 00:08:24
暴露了!黄珊珊与黄国昌确是民进党安排在民众党里的卧底?

暴露了!黄珊珊与黄国昌确是民进党安排在民众党里的卧底?

安安说
2024-09-08 02:31:45
青岛“逆行打人”路虎女被制成车贴,这是城市的耻辱印记

青岛“逆行打人”路虎女被制成车贴,这是城市的耻辱印记

人我场
2024-09-05 13:02:30
不打码都没法看,C罗和乔治娜度假时遇到一对全裸情侣在甲板上亲热

不打码都没法看,C罗和乔治娜度假时遇到一对全裸情侣在甲板上亲热

懂球帝
2024-09-06 21:12:15
新教材太难了!英语老师“破大防”:从教多年,这种句式第一次见

新教材太难了!英语老师“破大防”:从教多年,这种句式第一次见

妍妍教育日记
2024-09-07 17:12:11
一个小姑娘和父亲的留影,谁能想到日后她竟成为了大明星?

一个小姑娘和父亲的留影,谁能想到日后她竟成为了大明星?

视点历史
2024-09-08 00:15:02
贾平凹:人这一生,最高配的生活,就是拥有这3样东西

贾平凹:人这一生,最高配的生活,就是拥有这3样东西

清风拂心
2024-09-07 11:30:07
居然真的有这种职业 昨天观音桥坐电梯,发现一个好适合自己的工作……

居然真的有这种职业 昨天观音桥坐电梯,发现一个好适合自己的工作……

新浪财经
2024-09-08 00:24:06
网传保安趁女业主醉酒回家趁机揩油,发视频和朋友炫耀被挂到网上

网传保安趁女业主醉酒回家趁机揩油,发视频和朋友炫耀被挂到网上

看晓天下事
2024-09-07 12:24:57
普京请求中方高层参观海参崴,普京邀请中方参观海参崴目的何在?

普京请求中方高层参观海参崴,普京邀请中方参观海参崴目的何在?

说天说地说实事
2024-09-07 20:23:27
顶薪续约!Woj:贾马尔-穆雷4年2.08亿提前续约掘金

顶薪续约!Woj:贾马尔-穆雷4年2.08亿提前续约掘金

直播吧
2024-09-08 03:08:03
2024-09-08 11:24:49
新智元
新智元
AI产业主平台领航智能+时代
11507文章数 65585关注度
往期回顾 全部

科技要闻

超百万人线上预订 华为三折屏样机已到门店

头条要闻

牛弹琴:特朗普大喜 又拿下一个重大胜利

头条要闻

牛弹琴:特朗普大喜 又拿下一个重大胜利

体育要闻

24岁的锡安,正在和世界和解

娱乐要闻

37岁刘诗诗被吐槽脸越来越僵

财经要闻

至少52万人受灾 经济损失远超"威马逊"!

汽车要闻

轴距2900mm smart精灵#5将于9月20日预售

态度原创

手机
亲子
艺术
公开课
军事航空

手机要闻

华为三折叠手机Mate XT非凡大师预订!线下门店再现排队盛况 每人限1台

亲子要闻

别的小朋友在哭闹 她却反手一个耶,小孩姐:小小幼儿园 拿捏拿捏

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

公开课

简单的血液测试就能检测出癌症吗?

军事要闻

柬埔寨国防部:中国将向柬埔寨提供两艘056型护卫舰

无障碍浏览 进入关怀版