网易首页 > 网易号 > 正文 申请入驻

CVPR 2021 Oral | 室内动态场景中的相机重定位

0
分享至

作者 | PKU VCL

导读:本文是对发表于计算机视觉和模式识别领域的顶级会议 CVPR 2021的 Oral 论文 “Robust Neural Routing Through Space Partitions for Camera Relocalization in Dynamic Indoor Environments”(通过在空间划分中鲁棒的神经路由实现室内动态场景的相机重定位)的解读。

该论文由北京大学陈宝权研究团队与山东大学、北京电影学院、斯坦福大学和 Google Research 合作,针对室内动态变化场景的相机重定位问题,提出在场景空间划分中进行路由的思想,记忆场景静态信息的同时感知场景动态信息,从而实现鲁棒的相机位姿预测。

实验证明,该方法显著提升了动态变化场景中的相机重定位效果。

左:在场景空间划分中路由静态像素(绿色)和剔除动态像素(红色)

右:相机运动轨迹预测值(蓝色)与真实值(绿色)对比

1

研究背景

相机重定位研究在已知环境中根据 RGB-D 图像推算相机的位置姿态,是实现场景建模、增强现实、机器人导航等技术的基础。 近年来,最先进的研究工作通常 (A) 先记忆和推测所观测到不同对象的位置; (B) 再通过这些对象位置的相对关系反算自身位姿。 对于 (A),被观测对象的位置信息通常表示为图像像素坐标和场景世界坐标之间的对应关系(2D/3D-3D correspondences),使用决策树、神经网络等机器学习模型实现; 对于 (B),通常表示为局部坐标系与世界坐标系之间的刚体变换,使用 Perspective-n-Point、orthogonal Procrustes 等非机器学习算法求解。

相机位姿和观测得到的RGB-D图像

2

核心问题

现实环境中包含着多种多样的动态成分,造成场景日新月异的变化。这些动态变化给相机重定位带来了麻烦:一方面,动态变化引入噪声导致对应关系匹配失败;另一方面,匹配正确的对象可能由于位置变化导致相机位姿求解错误。由于动态变化难以预料、无法穷尽,所以不易使用监督学习的方法直接学习场景中的动态变化。即使应用 RANSAC 等鲁棒估计算法,也难以准确求解动态场景下的相机位姿。 因此,动态变化场景中的相机重定位面临挑战。

日常生活中动态变化的室内场景:家具移动,光照变化等

3

本文方法

为解决上述问题,我们提出 基于空间划分的神经路由算法 NeuralRouting 。 我们的直观见解是,场景中的动态变化通常表现为几何对象的三维位置改变。于是,我们从几何角度出发建模场景空间。

首先,我们将场景三维空间进行层次划分构建树形结构(space partition tree),树的每个节点对应场景中的一个区域。随着树的层次加深,场景区域划分由粗粒度走向细粒度。基于区域划分,我们使用神经网络学习图像像素在树中的路由(routing),从而记忆视觉对象在不同粒度场景空间中的位置。得益于空间划分,通过显式地设定错误路由(模拟三维位置改变),我们可以构造动态变化对象的标注,以此学习场景中的动态变化,将其作为一个额外的路由分类,称为离群节点(outlier)。如果一个像素属于静态区域,它将被路由到树的叶子节点,以该节点对应的场景区域作为预测结果;如果一个像素属于动态区域,它将被路由到离群节点,被视为噪声点拒绝进行区域预测。因此,图像中的每个像素如果不被拒绝,那么就会被映射到场景空间,从而建立了图像像素和场景空间之间鲁棒的对应关系。通过这些对应关系,我们使用基于 Kabsch 算法的 RANSAC 框架求解相机位姿。

以二维场景和3层4叉树作为例子,展示空间划分和路由模型

4

实验结论

具体地,我们使用 n 层 k 叉树对场景进行划分。 其中 k=2^z,对应于 z 次坐标轴二分。 例如,当 z=3 时,x, y, z 轴的依次二分使我们得到经典的八叉树模型。 对于树的每一层,路由表示为类别数量为 k+1 的分类任务,对应当前节点的 k 个子节点和1个离群节点。 由于树的各层分别对应于不同粒度的场景区域,在每一层的路由中我们使用相应尺度的感受野,从而兼顾全局和局部特征。 在实验中,我们使用5层16叉树预测像素和场景的对应关系,使用 preemptive RANSAC 求解相机位姿。 RIO-10(动态场景)和 7-Scenes(静态场景)数据集的实验结果证明,我们提出的 NeuralRouting 算法在动态场景中的相机重定位能力显著超越所有相关方法,在静态场景中也达到一流水平。

RIO-10和7-Scenes数据集的实验结果,红色标注最优,蓝色标注次优

5

总结

针对室内动态变化场景,我们提出可以感知动态点的相机重定位算法 NeuralRouting。 该方法 (1) 通过三维空间划分建模场景几何,(2) 使用神经网络记忆静态视觉对象的空间位置,(3) 感知并去除动态视觉对象的干扰。 实验证明,该方法有效地提升了动态变化场景中相机重定位效果。

论文链接:https://arxiv.org/abs/2012.04746

点击阅读原文,进入CVPR2021专区!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“香喷喷”中的喷,不读pēn,还是上小学的儿子纠正的我!

“香喷喷”中的喷,不读pēn,还是上小学的儿子纠正的我!

未央看点
2026-05-17 00:30:25
45岁才明白:微信上基本不发朋友圈的,十有八九是这两种人

45岁才明白:微信上基本不发朋友圈的,十有八九是这两种人

心理观察局
2026-05-08 09:43:07
日媒曝高市要访华,主动低头求和,并笃定一个事情,中方如何接招

日媒曝高市要访华,主动低头求和,并笃定一个事情,中方如何接招

基斯默默
2026-05-15 20:20:33
浙商证券男篮主场111:102力克深圳马可波罗,赢得半决赛开门红

浙商证券男篮主场111:102力克深圳马可波罗,赢得半决赛开门红

奔跑的象牙塔
2026-05-17 00:11:38
广东3消息!徐杰终止特训计划,杜锋发表讲话,萨林杰正式离队

广东3消息!徐杰终止特训计划,杜锋发表讲话,萨林杰正式离队

多特体育说
2026-05-16 23:42:03
太狂了!张本智和父亲公开放话,球迷怒了:以后别想再来中国了

太狂了!张本智和父亲公开放话,球迷怒了:以后别想再来中国了

青梅侃史啊
2026-05-16 09:52:38
硬刚天价垄断!央视5亿打包四届世界杯,FIFA为何被迫低头?

硬刚天价垄断!央视5亿打包四届世界杯,FIFA为何被迫低头?

落夜足球
2026-05-15 23:07:18
老板娘问我她屁股大不大?我该怎么回答?

老板娘问我她屁股大不大?我该怎么回答?

太急张三疯
2026-05-16 11:51:22
女性“巨阴症”可以生育吗?医生:主要看3种情况,不妨了解一下

女性“巨阴症”可以生育吗?医生:主要看3种情况,不妨了解一下

健康科普365
2026-05-03 09:30:28
夫妻本是同林鸟!但抱歉,这一次郭富城也救不了“作妖”的方媛

夫妻本是同林鸟!但抱歉,这一次郭富城也救不了“作妖”的方媛

揽星河的笔记
2026-05-15 20:11:07
大S年轻时房间曝光,太过诡异引人不适,难怪有人曾说活不过50岁

大S年轻时房间曝光,太过诡异引人不适,难怪有人曾说活不过50岁

草莓解说体育
2026-05-11 20:49:33
人类最大火箭更新:推力超1万吨,堪比055直接上天

人类最大火箭更新:推力超1万吨,堪比055直接上天

哎呀哎呀看电影
2026-05-16 09:17:34
杜锋下课王仕鹏接任,徐杰成核心,球迷万言书令朱芳雨沉默

杜锋下课王仕鹏接任,徐杰成核心,球迷万言书令朱芳雨沉默

林子说事
2026-05-16 10:14:33
凭什么让我滚出中国?张本智和回老家祭祖遭村民抵制,差点动手!

凭什么让我滚出中国?张本智和回老家祭祖遭村民抵制,差点动手!

拳击时空
2026-05-16 06:13:06
塞门约:努力终会有回报;我们所有人都很喜欢瓜帅

塞门约:努力终会有回报;我们所有人都很喜欢瓜帅

懂球帝
2026-05-17 00:33:23
美智库分析:歼-20雷达反射面为F-22百倍,战略目标不同

美智库分析:歼-20雷达反射面为F-22百倍,战略目标不同

一网打尽全球焦点
2026-05-15 03:38:00
黄仁勋赶飞机与中美“共建天坛”叙事:中美关系的张力与隐喻

黄仁勋赶飞机与中美“共建天坛”叙事:中美关系的张力与隐喻

澎湃新闻
2026-05-16 07:20:27
特朗普访华突然变“乖”?面子给足,筹码不放,中国早算准了他!

特朗普访华突然变“乖”?面子给足,筹码不放,中国早算准了他!

诗里寻那个他
2026-05-16 23:13:03
互联网是有记忆的,她的黑历史一大堆啊!

互联网是有记忆的,她的黑历史一大堆啊!

BenSir本色说
2026-04-15 22:38:07
马丁内斯:C罗踢球不是为了金钱与冠军荣誉,是为了不断突破自我

马丁内斯:C罗踢球不是为了金钱与冠军荣誉,是为了不断突破自我

林子说事
2026-05-16 18:18:32
2026-05-17 01:15:00
AI科技评论 incentive-icons
AI科技评论
点评学术,服务AI
7280文章数 20751关注度
往期回顾 全部

科技要闻

涨的是车价,要的是老命

头条要闻

13岁女孩被胁迫卖淫18次:主谋系其"好友" 未满16周岁

头条要闻

13岁女孩被胁迫卖淫18次:主谋系其"好友" 未满16周岁

体育要闻

马刺2号,少年老成,这集看过?

娱乐要闻

谢霆锋北京街头骑行被偶遇,侧颜帅炸

财经要闻

造词狂魔贾跃亭

汽车要闻

大五座SUV卷王!乐道L80上市 租电15.68万元起

态度原创

房产
本地
亲子
数码
军事航空

房产要闻

老黄埔热销之下,珠江春,为何去化仅3成?

本地新闻

用苏绣的方式,打开江西婺源

亲子要闻

万达二楼挺不错的少儿培训,想给我闺女安排一次。

数码要闻

科技巨头访华遇618 苹果、高通、英伟达集中促销中

军事要闻

联合国安理会审议叙利亚局势

无障碍浏览 进入关怀版