网易首页 > 网易号 > 正文 申请入驻

李飞飞空间智能上新!一张图就可以生成3D世界,能像玩游戏一样互动

0
分享至

智东西
编译|依婷
编辑|漠影

智东西12月3日消息,今日凌晨,由“AI教母”李飞飞联合创立并担任CEO的AI初创公司World Labs对外公布了他们的首个成果,3D世界生成模型,一个可以让用户从单张图片生成3D世界的AI系统。

World Labs的3D世界生成模型通过预测3D场景,实现了更高的可控性和一致性。

和市面上大多数将图片转化为3D的产品不同,使用该模型生成的3D场景,用户可以与之互动。比如,用户可以模拟相机进行对焦或滑动变焦,还可以在浏览器中与之实时交互,并能为场景添加交互效果和动画。

World Labs称,这是他们迈向空间智能的第一步。

一、生成的3D场景支持实时交互,可模拟相机对焦

1、用户可以在浏览器里与生成的3D场景交互

根据World Labs博客介绍,用户只需要提交一张图片,不论是由AI生成的图像,还是日常生活中拍摄的照片,3D世界生成模型都能根据该图片生成一个3D场景,且风格和原始图片保持一致。

▲左图为输入的图片,右图为模型生成的3D场景。

同时,和市面上将图片转化为3D建模或环境的产品不同,World Labs的3D世界生成模型生成的3D场景更像是开放世界游戏里的画面,它允许用户通过操作键盘、鼠标和场景交互,比如摁下“D”键向右移动,点击并划动鼠标转换视角。

▲通过键盘和鼠标在生成的3D场景里移动、转换视角。

2、像使用相机一样对生成的3D场景对焦、变焦

生成3D场景后,模型会使用虚拟相机在浏览器中实时渲染。用户在使用时通过拖动滑块精准控制虚拟相机,可实现艺术摄影效果。

比如,用户可以通过拖动滑块来模拟拍照时候的对焦,从而渲染出更清晰或模糊的画面。

▲通过移动滑块转换由远及近的焦距。

另外,在World Labs生成的3D场景中,用户还可以使用滑动变焦来调整虚拟相机的视野范围,从而获得不一样的视觉效果。

▲通过移动滑块可以模拟滑动变焦效果。

3、为生成的3D场景添加交互和动画效果

World Labs在博客中介绍,与大多数模型预测像素不同,他们预测3D场景,这么做有三个明显的优势:

连续性(Persistent Reality):模型生成的3D场景将一直存在,转换视角和移动都不会对已生成的场景产生影响;

实时控制(Real-Time Control):用户可以在场景中自由、实时移动,能凑近去看花的经络,也能抬头远望太空星云;

正确的几何结构(Correct Geometry):模型生成的3D场景遵循3D几何的基本物理规律,有立体感和纵深感。

正因为这些优势,用户可以在生成的3D场景中构建交互式效果。如选择声纳(Sonar)效果后再点击场景中的任一区域,该区域会出现对应效果。

▲对脉动、声纳、聚光灯三种交互效果的演示。

还可以为场景制作动画效果,比如选择波纹动态效果,整个画面就会像波纹一样动起来。

▲对波纹动画效果的演示。

二、内容创作者已开始试用,或将改变电影游戏制作方式

World Labs团队认为,3D世界生成模型将改变电影、游戏、模拟器和其它数字媒体的制作方式。他们展示了两个应用案例。

1、像带上VR眼镜一样游览世界名画

World Labs的模型可以根据梵高等世界知名画家的画作生成一个画中世界,让用户以全新的方式感受艺术作品。

▲模型根据梵高的画作《夜晚的咖啡馆露台》生成的3D场景。

2、与现有AI工具结合使用,加速内容创作

该3D世界生成模型可以与现有的其它AI工具结合使用,为内容创作者提供便利。比如,用户可以先使用文生图模型生成图像,再从生成的图像创建3D世界。虽然不同的文生图模型有不同的风格,生成的3D场景依然可以适配这些风格。

World Labs给出了一个示例。他们给四个不同的文生图模型输入了同一组提示词,再根据生成的不同风格的图像创建了对应风格的3D场景。

提示词为:A vibrant cartoon-style teenager’s bedroom with a bed covered in colorful blankets, a cluttered desk with a computer, posters on the walls, and scattered sports gear. A guitar leans against the wall, and a cozy, patterned rug is in the center. Light from a window adds a warm, youthful vibe to the room.(一间充满活力的卡通风格青少年卧室,床上铺着五颜六色的毯子,杂乱的书桌上放着一台电脑,墙上贴着海报,运动装备散落。一把吉他靠在墙上,中间是一块舒适的图案地毯。窗外的光线为房间增添了温暖、年轻的氛围。)

▲3D世界生成模型在同一主题、不同风格的AI图片中的表现。

一些创作者已经开始内测他们的模型了。

//oss.zhidx.com/uploads/2024/12/674ec061e7cf1_674ec061e3a7e_674ec061e3a49_1.mp4

▲创作者Eric Solorio通过3D世界生成模型给画面加入角色并精确地调度虚拟相机完成“拍摄”。

//oss.zhidx.com/uploads/2024/12/674ec04e468d6_674ec04e429c5_674ec04e42989_黄豆豆。-2024-12-12-16.21.36.mp4

▲创作者Brittani Natali将3D世界生成模型与Midjourney、Runway、Suno、ElevenLabs、Blender和CapCut等工具结合使用,通过三支短片传递了不同情绪。

当然,目前该模型还存在一些不足,例如生成的3D场景可探索区域有限,在移动一小段距离后,它就会提示已达到边界;某些场景会出现渲染错误,不同的物体以不自然的方式融合,成为了一团色块。

World Labs表示,以上成果还偏早期,他们正在努力提高生成世界的大小和拟真度,也正在试验用户与它们交互的新方式。

三、公司成立不到三个月,估值超过10亿美元

World Labs于今年9月13日正式宣布成立,是一家空间智能AI公司,试图构建大型世界模型(LWM)来感知、生成3D世界并与之交互。前谷歌云AI负责人、斯坦福大学教授李飞飞是该公司的联合创始人兼CEO。

▲李飞飞在AI Optimist Club发表演讲(图源:福布斯)

World Labs在博客中写道:“我们的目标是将AI模型从像素的2D平面提升到完整的3D世界,赋予它们与我们一样丰富的空间智能。”

据《福布斯》9月19日报道,成立不到一个星期,World Labs的估值就已经超过10亿美元。

彼时,World Labs筹集了2.3亿美元的风投资金,投资方包括Andreessen Horowitz(a16z)、NEA和Radical Ventures在内的美国知名风投机构,以及Salesforce公司创始人兼CEO Marc Benioff和英伟达(Nvidia)旗下投资部门NVenture。

该公司预计到2025年发布首批产品,应用范围包括游戏、机器人以及其他潜在行业。

结语:空间智能,生成式AI迈入下一阶段

从自然语言到图片、视频、3D建模,再到如今的空间计算,两年时间,生成式AI正在以极快的速度认知、理解、模拟、生成人类所存在的物理世界。

在即将到来的2025年,由World Labs开启的空间智能AI竞争或将重现今年各大AI视频生成应用厂商的盛况,生成式AI也有可能由此迈入下一阶段。

来源:World Labs、《福布斯》

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
法国51岁银行高管残酷虐待女友7年,并强迫她向数百名男性卖淫......判了!

法国51岁银行高管残酷虐待女友7年,并强迫她向数百名男性卖淫......判了!

新民周刊
2026-05-26 17:39:32
正在悄悄消失的“酒局”

正在悄悄消失的“酒局”

职场资深秘书
2026-05-26 17:09:59
二婚夫妻的悲哀:因家庭琐事积怨对妻子痛下杀手,掐死后抛尸荒野

二婚夫妻的悲哀:因家庭琐事积怨对妻子痛下杀手,掐死后抛尸荒野

易玄
2026-05-26 00:23:50
25分钟仅拿1分!赛后却获主教练力捧,他防住了对方头号得分手

25分钟仅拿1分!赛后却获主教练力捧,他防住了对方头号得分手

老叶评球
2026-05-26 22:41:33
FBI警告:黑客用微软正版登录页偷账号,能绕过双重验证

FBI警告:黑客用微软正版登录页偷账号,能绕过双重验证

算力游侠
2026-05-26 02:41:25
3000万敲定!巴萨抢人成功,罗马连挖曼联2弃将太狠!

3000万敲定!巴萨抢人成功,罗马连挖曼联2弃将太狠!

林子说事
2026-05-26 15:52:15
绝了!男老师搂着学生拍“小宝”视频,网友:这教资是不想要了吧

绝了!男老师搂着学生拍“小宝”视频,网友:这教资是不想要了吧

优墨出品
2026-05-24 10:48:35
乌克兰已确定白俄罗斯境内的首批 500 个目标

乌克兰已确定白俄罗斯境内的首批 500 个目标

魅力乌克兰
2026-05-27 01:05:10
002535,被证监会立案调查!

002535,被证监会立案调查!

证券时报e公司
2026-05-26 21:38:57
不用3nm照样封神!麒麟9050性能超越A18:3D堆叠绕开制程封锁

不用3nm照样封神!麒麟9050性能超越A18:3D堆叠绕开制程封锁

快科技
2026-05-26 11:37:30
签了!湖人休赛期第一笔签约!詹姆斯回骑士的概率大增...

签了!湖人休赛期第一笔签约!詹姆斯回骑士的概率大增...

詹姆斯吧
2026-05-26 10:41:24
老板歧视内地游客后续:被扒是惯犯,已道歉认怂,下场大快人心

老板歧视内地游客后续:被扒是惯犯,已道歉认怂,下场大快人心

阿纂看事
2026-05-26 16:36:31
湖南"监狱土皇帝"钟艺兵,演了30年,终于演砸了

湖南"监狱土皇帝"钟艺兵,演了30年,终于演砸了

娱乐的宅急便
2026-05-27 00:41:02
“她支持乌克兰”:波利亚科娃就丑闻缠身的洛博达发表了声明。

“她支持乌克兰”:波利亚科娃就丑闻缠身的洛博达发表了声明。

魅力乌克兰
2026-05-27 01:20:54
被网友们“低成本防蚊大法”惊到了!不花啥钱,让蚊子不敢靠近

被网友们“低成本防蚊大法”惊到了!不花啥钱,让蚊子不敢靠近

抠搜侠
2026-05-25 14:33:50
国内将逐渐停止"肠镜检查"?做完对身体有无影响?医生告诉您真相

国内将逐渐停止"肠镜检查"?做完对身体有无影响?医生告诉您真相

路医生健康科普
2026-05-26 17:14:33
热议!意大利公布24 人大名单:除多纳鲁马之外全员U23

热议!意大利公布24 人大名单:除多纳鲁马之外全员U23

林子说事
2026-05-26 18:09:36
尼克斯重返总决赛!布伦森1999年总决赛萌照曝光,冥冥自有天意

尼克斯重返总决赛!布伦森1999年总决赛萌照曝光,冥冥自有天意

仰卧撑FTUer
2026-05-26 14:34:08
内塔尼亚胡夜间突然被急送医,外界提前关注“后内塔尼亚胡时代”

内塔尼亚胡夜间突然被急送医,外界提前关注“后内塔尼亚胡时代”

阿龙聊军事
2026-05-26 20:44:21
落选西班牙名单身价前10:费尔明1亿欧第1,赫伊森6500万第2

落选西班牙名单身价前10:费尔明1亿欧第1,赫伊森6500万第2

懂球帝
2026-05-27 04:04:52
2026-05-27 05:27:00
智东西 incentive-icons
智东西
智东西,AI产业新媒体,专注报道人工智能的前沿技术发展,和技术应用带来的千行百业产业变革。
11900文章数 117085关注度
往期回顾 全部

科技要闻

中国AI要向外卷,而不只是做第二个OpenAI

头条要闻

武契奇获授"友谊勋章":父母特意打电话 我们都哭了

头条要闻

武契奇获授"友谊勋章":父母特意打电话 我们都哭了

体育要闻

上赛季差点降入英甲,下赛季要踢英超了

娱乐要闻

台媒贴脸!S妈被问大S嗑药当场沉默

财经要闻

中国铝行业爆单 下一个“煤炭”大周期?

汽车要闻

涉水加强 福特烈马亚马逊限量版上市 售价39.98万

态度原创

旅游
游戏
本地
数码
公开课

旅游要闻

第二艘国产大型邮轮即将启航:解锁中国人的海上旅居新范式!

猎魂世界:千仞雪/王秋儿售后盘点!售后是越多越好还是越少越好

本地新闻

用云锦的方式,打开江苏南京

数码要闻

CPU缺货涨价持续!国产芯片借势突破高端壁垒

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版