网易首页 > 网易号 > 正文 申请入驻

Sora 在英伟达 H100 上生成 1 分钟视频约需 12 分钟

0
分享至

上方蓝字关注我们

Sora模型的成本:

  • Sora的训练需要大量的计算资源,估计需要4211-10528个 Nvidia H100 GPUs运行一个月。

  • 推理成本:一个Nvidia H100 GPU大约每小时能生成5分钟的视频。

  • 初期的Sora成本将非常高,肯定是不适合普通人来使用,所以目前OpenAI都是先找一些艺术和电影工作室或者公司合作。


我们尝试从 DiT 模型的训练细节推断 Sora 的训练计算量。DiT-XL 模型拥有 6.75亿 参数,其训练总计算量约为 10^21 FLOPS。简单来说,这相当于使用 0.4 台 Nvidia H100 计算一个月,或者一台 H100 计算 12 天。

尽管 DiT 仅处理图像,而 Sora 则是视频模型,能够生成长达 1 分钟的视频。假设视频以 24fps 编码,那么一个视频最多包含 1,440 帧。如果按照 DiT 论文中的压缩率(8x)计算,Sora 在潜在空间中可能只处理 180 帧。这意味着,如果我们简单地将 DiT 的计算量外推到视频,计算量将增加 180 倍。

我们估计 Sora 的参数量可能远远超过 6.75亿,可能达到 20B 参数,这使得计算量再增加 30 倍。

此外,我们认为 Sora 训练所用的数据集规模远超 DiT。DiT 训练了 3M 步,批量大小为 256,总共处理了 768M 张图像(尽管 ImageNet 只有 14M 张图像,数据被重复使用)。Sora 似乎使用了图像和视频的混合数据集,但我们对具体内容知之甚少。我们假设 Sora 的数据集有 50% 是静态图像,50% 是视频,并且数据集规模是 DiT 的 10 到 100 倍。然而,考虑到 DiT 重复使用相同数据点,如果有一个更大的数据集,这种重复使用可能不是最佳选择。因此,我们认为计算量的增加可能是 4 到 10 倍。

综合以上因素,我们估算 Sora 的训练计算量可能在 1.1x10^25 (低数据集)到 2.7x10^25 FLOPS (高数据集)之间,相当于 4,211 到 10,528 个 Nvidia H100 计算一个月。

我们还关注训练计算与推理计算的比较。训练计算虽然巨大,但只需一次性投入;而推理计算虽然较小,却会随着每次生成而产生,并且随着模型的普及而变得越来越重要。

我们进一步探讨了 DiT 和 Sora 的训练与推理计算,并给出了两个估算:一个基于数据集规模增加 4 倍的低估算,和一个基于增加 10 倍的高估算。

对于 Sora,我们根据 DiT 的数据推算出其 FLOPS 为 2.8×10^15 FLOPS。假设每个视频需要 250 个扩散步骤,那么每个视频的总计算量为 708×10^15 FLOPS。以 Nvidia H100 每小时生成 5 分钟视频的速度计算,盈亏平衡点在生成 15.3M 到 38.1M 分钟视频后到来,此后推理计算将超过训练计算。

我们还比较了不同模型在不同模态下每单位输出的推理计算量。我们发现,像 Sora 这样的基于扩散的模型在推理时的计算成本要高得多:DiT-XL(675M 参数)的推理计算量与 LLama 2(70B 参数)相当。Sora 的推理计算量甚至比 GPT-4 高几个数量级。

需要注意的是,上述数字都是基于简化假设的估算,并未考虑 GPU 的实际 FLOPS 利用率、内存容量和带宽限制等因素。

如果我们假设 Sora 这样的模型在市场上获得显著份额,我们需要估算支持大规模 AI 生成视频所需的 Nvidia H100 数量。我们假设每台 Nvidia H100 每小时能生成 5 分钟视频,那么每天能生成 120 分钟视频。

根据 TikTok 和 YouTube 的视频上传数据,我们估算出 AI 生成的视频每天需要 10.7M 分钟,这意味着需要大约 89k 台 Nvidia H100 来支持创作者社区。然而,这个数字可能低估了实际需求,因为我们需要考虑到 FLOPS 利用率、需求的不均匀分布、峰值需求以及创作者生成多个候选视频的情况。总的来说,在峰值时可能需要大约 720k 台 Nvidia H100 GPU。

这表明,随着生成性 AI 模型越来越受欢迎,推理计算将成为主导。对于像 Sora 这样的基于扩散的模型,这一点尤为明显。同时,模型规模的扩大将进一步增加推理计算需求,但通过优化推理技术和整个计算堆栈的其他优化,可以部分抵消这种增加。

原文:https://www.factorialfunds.com/blog/under-the-hood-how-openai-s-sora-model-works

Sora:大型视觉模型的背景、技术、局限性和机遇综述

人人都能看懂的Sora技术报告

OpenAI发布强大的视频生成工具,让整个行业哀鸿遍野

已有超过2000名

读者加入交流群

我们还在等你

点这里关注我,记得标星哦~

CLICK TO SEE YOU LOOK THE BEST

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
傅首尔瘦成瓜子脸上热搜,网友:弥补了瘦人没有傅首尔面相的缺憾

傅首尔瘦成瓜子脸上热搜,网友:弥补了瘦人没有傅首尔面相的缺憾

映射生活的身影
2026-06-03 15:48:06
马汉航空:中国往返伊朗航线全面恢复运营

马汉航空:中国往返伊朗航线全面恢复运营

界面新闻
2026-06-04 14:19:12
刘品言夫妇一家三口现身街头,半岁女儿首曝光,白白胖胖太萌了

刘品言夫妇一家三口现身街头,半岁女儿首曝光,白白胖胖太萌了

小椰的奶奶
2026-06-04 12:22:05
跟儿女相处:讲道理是下策,闭嘴是中策,上策你绝对想不到

跟儿女相处:讲道理是下策,闭嘴是中策,上策你绝对想不到

热心市民小黄
2026-06-03 13:30:41
贵州女子刚生产完,丈夫冲到产房将其脑袋砍下:她死有余辜

贵州女子刚生产完,丈夫冲到产房将其脑袋砍下:她死有余辜

莫地方
2026-06-04 01:45:03
李连杰携家人拜见仁波切,64岁利智罕露面,全家向大师鞠躬很虔诚

李连杰携家人拜见仁波切,64岁利智罕露面,全家向大师鞠躬很虔诚

蒂蒂茱家
2026-06-02 15:52:12
突发利空,PCB龙头减持套现40亿,这39个光通信股集体大幅减持

突发利空,PCB龙头减持套现40亿,这39个光通信股集体大幅减持

风风顺
2026-06-04 12:27:03
谈崩了!林良铭要顶薪大合同 连沪粤鄂滇铁人哄抢 国安勿人财两空

谈崩了!林良铭要顶薪大合同 连沪粤鄂滇铁人哄抢 国安勿人财两空

刀锋体育
2026-06-04 08:36:31
美媒:中国“无围壳”潜艇打破百年传统,代差式领先欧美

美媒:中国“无围壳”潜艇打破百年传统,代差式领先欧美

世家宝
2026-06-04 13:55:41
老挝国家主席抵达北京 继续访华行程

老挝国家主席抵达北京 继续访华行程

看看新闻Knews
2026-06-04 15:44:03
将要迎来高温天气,医生再三劝告:天热宁可看电视,也别做4件事

将要迎来高温天气,医生再三劝告:天热宁可看电视,也别做4件事

芹姐说生活
2026-06-03 23:57:55
日本国会喊话政府向乌提供爱国者导弹,美众议院通过新援乌法案

日本国会喊话政府向乌提供爱国者导弹,美众议院通过新援乌法案

史政先锋
2026-06-04 15:49:22
入户登记到底查什么?认准这5项红线,别被套路了!

入户登记到底查什么?认准这5项红线,别被套路了!

小谈食刻美食
2026-06-04 07:07:42
不想上班?辞职上山的年轻人最后还是下山了

不想上班?辞职上山的年轻人最后还是下山了

红星新闻
2026-06-03 20:56:44
端午假期“有点挤”,国际燃油价格波动中长途客流回流至铁路

端午假期“有点挤”,国际燃油价格波动中长途客流回流至铁路

新京报
2026-06-03 15:52:43
佩斯科夫称“特别军事行动”是为了防止遭受圣彼得堡那样的袭击

佩斯科夫称“特别军事行动”是为了防止遭受圣彼得堡那样的袭击

山河路口
2026-06-03 20:04:38
31条中日航线5月取消全部航班

31条中日航线5月取消全部航班

财联社
2026-06-03 15:56:05
基建英雄变老赖,谁在透支中国基建的未来?

基建英雄变老赖,谁在透支中国基建的未来?

秦朔朋友圈
2026-06-04 00:09:20
乔治娜天生容貌身材本就出众,过度医美反倒耗损了原有气质

乔治娜天生容貌身材本就出众,过度医美反倒耗损了原有气质

述家娱记
2026-05-30 06:56:13
乌克兰军队的最大优点,俄军学不来

乌克兰军队的最大优点,俄军学不来

名人苟或
2026-06-03 16:31:16
2026-06-04 17:40:49
AI范儿 incentive-icons
AI范儿
AI范儿是一个专注于人工智能领域的资讯和学习平台,提供最新的人工智能资讯
755文章数 674关注度
往期回顾 全部

科技要闻

历史最大IPO!马斯克下周冲击万亿富豪

头条要闻

女子花27万买的车4年后突然被扣押 交管部门:是"假车"

头条要闻

女子花27万买的车4年后突然被扣押 交管部门:是"假车"

体育要闻

欧冠决赛躺赢?他也曾是大巴黎的英雄

娱乐要闻

难怪奚梦瑶能嫁入豪门

财经要闻

SpaceX发行价135美元 6月12日上市交易

汽车要闻

北京现代5月销量强势反弹:国内17065辆 出口环比翻倍

态度原创

健康
艺术
旅游
亲子
军事航空

违规干细胞抗衰美容,为何肆无忌惮

艺术要闻

唐寅『梅花册』

旅游要闻

1.5亿人次复苏背后 入境游面临 “软实力”大考

亲子要闻

一顿半斤肉,12岁男孩体重超200斤,确诊糖尿病前期

军事要闻

美众议院要求特朗普停止对伊动武并撤军

无障碍浏览 进入关怀版