网易首页 > 网易号 > 正文 申请入驻

图片生成新视角,索尼开源GenWarp框架支持图片到3D场景构建

0
分享至

生成一张从新角度看事物的图片是件很难的事,因为3D场景本身很复杂,而且用来训练模型的多角度图片数据也不够多样。最近,有研究人员把大规模的文本生成图像(T2I)模型和单目深度估计(MDE)结合起来,用来处理一些复杂的自然场景图片。这些方法通常是先通过深度图将图片变形,然后用T2I模型来修补这些变形的图片。不过,这些方法在应对深度图中的噪声和保留图像细节方面还存在问题,尤其是当需要从一个角度变换到另一个角度时。

为了解决这些问题,索尼提出了一种新方法,叫做“单视角生成新视角的语义保留生成变形框架”。这个框架通过增强不同视角之间的注意力,使得T2I模型能够学会何时进行图片的变形,何时生成新的内容。(链接在文章底部

01 技术原理

假设你有一张图片和一个你想要的相机角度。我们首先会得到两个东西:一个是这张图片的二维坐标,另一个是这个新角度下的变形坐标。然后,语义保留网络会用这些坐标提取出这张图片的主要特征,而基于这些特征的扩散模型会学着如何把图片变形,生成新的视角。

模型仅基于单一输入视图即可生成合理的新视图,从而能够处理域内图像(顶部)和域外图像(底部)。模型可以应用于各种下游任务。例如,给定一张图像,模型会生成 3-4 张新视图图像,然后将它们输入到快速 3DGS 重建器(如InstantSplat )中。然后我们可以在 30 秒内轻松获得 3DGS 场景。

GenWarp引入了一种新方法,其中扩散模型学习以 MDE 深度对应关系为条件隐式进行几何扭曲,而不是直接扭曲像素或特征。模型以在生成过程中交互补偿扭曲不良区域,从而防止通常由显式扭曲引起的伪影。

增强的自注意力机制中,原始的自注意力部分更关注需要生成先验的区域,例如遮挡或扭曲不良的区域(顶部),而跨视图注意力部分则关注可以从输入视图可靠扭曲的区域(底部)。通过同时聚合两种注意力,模型可以自然地确定要生成哪些区域以及要扭曲哪些区域。

根据输入图像和估计的深度重建的 3D 场景。(中)扭曲的图像。(右)生成的图像。

模型可以处理来自各个领域的图像,包括室内/室外场景,甚至具有挑战性的相机视点变化的插图。

https://arxiv.org/abs/2405.17251
https://huggingface.co/spaces/Sony/genwarp
https://github.com/sony/genwarp

欢迎交流~,带你学习AI,了解AI

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
澳门回归25周年文艺晚会,节目安排有深意,晚会不见内地歌手身影

澳门回归25周年文艺晚会,节目安排有深意,晚会不见内地歌手身影

山河月明史
2024-12-20 21:54:26
曼城前锋集体消失!6人入11球,福登29射才破荒,2人0进球

曼城前锋集体消失!6人入11球,福登29射才破荒,2人0进球

奥拜尔
2024-12-21 22:33:59
斯洛伐克总理:泽连斯基的建议“荒谬”

斯洛伐克总理:泽连斯基的建议“荒谬”

参考消息
2024-12-20 19:00:06
证监会暂停IPO融资!今日凌晨的四大消息冲击市场(12.21)!

证监会暂停IPO融资!今日凌晨的四大消息冲击市场(12.21)!

风口招财猪
2024-12-21 01:11:37
4对夫妻抱团养老,三年后2个家庭散伙,64岁阿姨哭诉:再不走,家都没了

4对夫妻抱团养老,三年后2个家庭散伙,64岁阿姨哭诉:再不走,家都没了

财经三分钟pro
2024-12-13 13:02:30
全网曝光超10亿!今冬新顶流“搪瓷盆”火到饮品圈

全网曝光超10亿!今冬新顶流“搪瓷盆”火到饮品圈

马蹄烫嘴说美食
2024-12-21 22:54:05
中国一个奇怪的现象:收入1万以下的夫妻,吵架基本都是为了钱;1万以上的家庭,吵架都是一方很强势。

中国一个奇怪的现象:收入1万以下的夫妻,吵架基本都是为了钱;1万以上的家庭,吵架都是一方很强势。

财经三分钟pro
2024-12-07 08:42:59
中年女人一定要记住:千万别在婚姻里打工,不然你就废了

中年女人一定要记住:千万别在婚姻里打工,不然你就废了

东林夕亭
2024-12-21 23:08:54
巴基斯坦突发!16名军人丧生

巴基斯坦突发!16名军人丧生

参考消息
2024-12-21 20:56:36
官宣签约!恭喜考辛斯,重返职业赛场

官宣签约!恭喜考辛斯,重返职业赛场

鬼魅突破上篮
2024-12-21 17:42:03
冉莹颖自曝和丈夫邹市明分房3年,坦言婚姻不一定要有性!

冉莹颖自曝和丈夫邹市明分房3年,坦言婚姻不一定要有性!

毒舌嬷嬷
2024-12-21 09:29:21
深圳官方回应“市体育中心何时完工开放”

深圳官方回应“市体育中心何时完工开放”

鲁中晨报
2024-12-21 18:03:10
世俱杯决赛:天津vs科内利亚诺,遏制朱婷是关键,王艺竹要站出来

世俱杯决赛:天津vs科内利亚诺,遏制朱婷是关键,王艺竹要站出来

骑马寺的少年
2024-12-21 22:12:50
43分+13板+16助+5断+3帽!对不起,哈登,你很难进全明星

43分+13板+16助+5断+3帽!对不起,哈登,你很难进全明星

世界体育圈
2024-12-21 19:20:32
丰田新车刚降价就爆卖10900+,四驱+航空座椅,懂车的都喜欢买它

丰田新车刚降价就爆卖10900+,四驱+航空座椅,懂车的都喜欢买它

爱论历史
2024-12-19 23:31:54
事实证明,开演唱会2600万收入全捐出去的刀郎,已走上另一条大道

事实证明,开演唱会2600万收入全捐出去的刀郎,已走上另一条大道

林轻吟
2024-10-18 06:25:03
长大了才理解大人为什么不爱吃零食!网友:这原因太真实了!

长大了才理解大人为什么不爱吃零食!网友:这原因太真实了!

热闹的河马
2024-12-20 10:02:08
埃梅里:下半场我们踢得更好;曼城上半场的统治力超出了预期

埃梅里:下半场我们踢得更好;曼城上半场的统治力超出了预期

懂球帝
2024-12-21 23:50:19
汪东兴后人:次子曾担任中央警卫局长,女婿是武警大校

汪东兴后人:次子曾担任中央警卫局长,女婿是武警大校

我是斌哥哥
2024-01-20 21:49:39
怎么过圣诞?北京教堂已经开卷了!

怎么过圣诞?北京教堂已经开卷了!

时尚旅游
2024-12-20 19:05:59
2024-12-22 00:07:00
带你学AI
带你学AI
分享最前沿AI知识,先进的AI工具
170文章数 3关注度
往期回顾 全部

科技要闻

蔚来发布ET9 售价78.8万 首发限量版81.8万

头条要闻

消息人士:以色列或将对也门胡塞武装发起"终极打击"

头条要闻

消息人士:以色列或将对也门胡塞武装发起"终极打击"

体育要闻

“他不再是那个数据刷子了”

娱乐要闻

叶柯现身酒店被偶遇 心情超好 小腹隆起孕肚明显

财经要闻

国潮褪去,李宁掉队!

汽车要闻

预售37.98万 坦克500Hi4-Z将于1月1日上市

态度原创

数码
家居
艺术
房产
手机

数码要闻

CPU-Z 发布 2.13 版本更新:支持英特尔 Arrow Lake-U 处理器

家居要闻

现代轻奢 新中式的和谐交响

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

房产要闻

刚刚,三亚万科官宣:首开爆卖40.8亿!

手机要闻

vivo继续衍生:iQOO Z9 Turbo长续航版,配置参数清晰且在路上!

无障碍浏览 进入关怀版