网易首页 > 网易号 > 正文 申请入驻

ICCV 2021 | UCLA提出:基于张量CUR的快速鲁棒张量主成分分析算法

0
分享至

作者 | HanQin Cai, Zehan Chao, Longxiu Huang

编辑 | 王晔

本文是对发表于国际计算机视觉大会ICCV的Workshop论文“Fast Robust Tensor Principal Component Analysis via Fiber CUR Decomposition”[1] 的介绍。

该论文由UCLA大学数学系HanQin Cai, Zehan Chao, Longxiu Huang, and Deanna Needell共同完成。

论文arXiv链接:https://arxiv.org/abs/2108.10448

1

研究简介

我们的研究主要是关于鲁棒张量主成分分析的算法,也可以称作鲁棒张量分解算法。与传统的高维奇异值分解算法(HOSVD)不同,我们的算法是基于【张量CUR分解】【交替映射法】衍生出的关于张量分解的一套算法。解决同样的张量问题有非常大的时间复杂度优势,同时也不会受限于被稀疏离群值 (sparse outlier)破坏的数据。我们通过大量的模拟数据实验与真实数据实验来验证了算法的可行性与鲁棒性。

2

研究背景

主成分分析(PCA)是一种基础的数学分析方法,为对多变量数据进行降维以便更好的分析及可视化。矩阵数据的PCA通常与矩阵分解密切相关,例如一种常见的PCA问题定义为获得矩阵的低秩趋近:

这个问题可以通过矩阵的截断奇异值分解(truncated SVD)来完成。

传统的PCA存在一些公认的缺点,例如对于离群值非常敏感,少数几个离群值会完全扰乱算法的输出。因此在这之上一些研究转向了鲁棒主成分分析 (Robust PCA、RPCA)。RPCA在PCA的基础上增加了对于稀疏离群值的容忍度:

此处,额外的稀疏矩阵S吸收原数据D的离群值,从而使得输出结果L更加鲁棒。

张量(Tensor)是比矩阵更广义的结构,可以看作多维度版本的矩阵;同样,矩阵可以定义为二维的张量。在各种关于数据科学的研究中,张量被认为可以比矩阵更好地保存原数据的结构,从而产生了各类对张量的研究。其中,张量的鲁棒主成分分析,即鲁棒分解问题,就是我们算法处理的主要问题。即:

注意,张量的秩存在多种不同的定义。在此文中,我们着重研究张量的多线性秩(multilinear rank),也称为塔克秩 (Tucker rank)

3

方法介绍

最初的CUR分解属于矩阵分解的一种,与LU分解,SVD分解类似:

其中,C指的是原矩阵提取的列,R指的是原矩阵提取的行,U 是 C和R的交叉部分。CUR分解总是成立的当U的秩等于A的秩(详细内容可参考论文[2])。

将这个概念拓展到高维张量里,我们就有了张量版本的CUR分解(张量CUR有Chidori CUR和 Fiber CUR两个版本,本文使用Fiber CUR。详细内容可参考论文[3])

在此之上,结合交替映射算法的概念,我们开发了称之为鲁棒张量CUR (Robust Tensor CUR、RTCUR)的算法:

其中,第5行的resample是可以在每个迭代中进行也可以始终统一,进而演化成了两种算法,RTCUR-R与RTCUR-F。这两种算法的区别在于,Resample的算法(RTCUR-R)在处理更密的离群值数据时比Fixed index算法(RTCUR-F)要稳定一些,但RTCUR-F算法因为每次迭代中不用重新选择张量中的数据,在运行时间上稍有优势,以及RTCUR-F只需要取原张量中非常小的一部分数据,从而对数据缺失有更高的容忍度。

4

实验结果

首先,我们研究RTCUR算法的采样系数(Sampling Constant)与离群值密度的相变图。我们生成固定秩的三维张量,然后加入不同密度的离群值,运行不同采样系数RTCUR算法进行检测。从而根据RTCUR算法是否可以准确恢复原低秩张量L来画出如下相变图:

从相变图中可以看到,在采样系数取在3~5之间时,我们可以获得较高的离群值容忍度同时保持算法的较快运行。

接着,我们生成了不同尺寸的低秩三维张量和随机稀疏离群值来测试各种算法的运行时间与结果准确性。实验结果发现,基本所有的算法对于 20%的离群值都可以准确地分离出低秩部分与稀疏离群值部分。从时间对比图上也可以看到处理张量鲁棒分解问题时,RTCUR拥有巨大的时间优势:

我们又测试了不同的真实数据集,其中一项任务是彩色视频的背景分离。比如在一段行人走在街上的视频,彩色的低秩背景街道可以视为张量, 而移动中的行人则可视为离群值。通过几段不同的视频测试,我们的RTCUR算法都可以获得很好的分离效果:

当然,不同算法的效果略有差异,但总体都成功的分离了背景与前景。在这之上,RTCUR算法对于真实数据同样有明显的时间优势(见Table 1)。

5

总结

本文针对张量鲁棒主成分分析问题提出了一个基于张量CUR的快速算法。从模拟数据和真实数据来看,我们的算法在准确有效的同时极大地提升了速度。我们未来会在算法的理论方面探讨一些思路和可能性。

期刊扩展版会很快推出,欢迎大家关注我们后续的工作。

参考文献

[1] H.Q. Cai, Z. Chao, L. Huang, and D. Needell. Fast Robust Tensor Principal Component Analysis via Fiber CUR Decomposition. International Conference on Computer Vision (ICCV) Workshop on Robust Subspace Learning and Applications in Computer Vision, 2021.

[2] K. Hamm and L. Huang. Perspectives on CUR decompositions. Applied and Computational Harmonic Analysis (ACHA), 48(3): 1088-1099, 2020.

[3] H.Q. Cai, K. Hamm, L. Huang, and D. Needell. Mode-wise Tensor Decompositions: Multi-dimensional Generalizations of CUR Decompositions. Journal of Machine Learning Research (JMLR), 22(185):1-36, 2021.

[4] C. Lu, J. Feng, Y. Chen, W. Liu, Z. Lin, and S. Yan, Tensor robust principal component analysis with a new tensor nuclear norm, IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 42(4): 925–938, 2019.

[5] H.Q. Cai, J. Cai, and K. Wei. Accelerated Alternating Projections for Robust Principal Component Analysis. Journal of Machine Learning Research (JMLR), 20(20): 1-33, 2019.

[6] H.Q. Cai, K. Hamm, L. Huang, J. Li and T. Wang. Rapid Robust Principal Component Analysis: CUR Accelerated Inexact Low Rank Estimation. IEEE Signal Processing Letters (IEEE SPL), 28: 116-120, 2020.

扫码添加小助手微信(AIyanxishe3),备注ICCV2021拉你进群。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
斯诺克战报!5-1,5-4,小特火箭告捷,丁俊晖开门黑,小司机惜败

斯诺克战报!5-1,5-4,小特火箭告捷,丁俊晖开门黑,小司机惜败

刘姚尧的文字城堡
2024-12-26 09:58:17
18岁纹面男孩:做网红被封杀,纹身也洗不掉,找工作无人收

18岁纹面男孩:做网红被封杀,纹身也洗不掉,找工作无人收

青橘罐头
2024-11-13 07:30:20
这5个习惯最毁车,做过两个以上的,会导致车辆寿命短车况差

这5个习惯最毁车,做过两个以上的,会导致车辆寿命短车况差

沙雕小琳琳
2024-12-26 18:43:08
莫言说:当你老了,躺在病床上面,无依无靠时,你就会明白:这辈子最亲的,并非血脉至亲,竟是这3样东西。

莫言说:当你老了,躺在病床上面,无依无靠时,你就会明白:这辈子最亲的,并非血脉至亲,竟是这3样东西。

财经三分钟pro
2024-12-11 17:27:43
圣诞档票房断崖式下跌,仅为去年三分之一,“舔狗”经济崩盘了!

圣诞档票房断崖式下跌,仅为去年三分之一,“舔狗”经济崩盘了!

眼光很亮
2024-12-26 11:20:45
10枚弹道导弹砸向以色列!以军基地被炸,胡塞武装收到死亡威胁

10枚弹道导弹砸向以色列!以军基地被炸,胡塞武装收到死亡威胁

纾瑶
2024-12-26 19:42:42
惊艳新剧终于又爆发,播到第8集飙到9.8分!

惊艳新剧终于又爆发,播到第8集飙到9.8分!

热荐电影
2024-12-26 11:59:02
赔偿了新加坡9500万美元,这条350公里的跨国高铁项目戛然而止!

赔偿了新加坡9500万美元,这条350公里的跨国高铁项目戛然而止!

星辰故事屋
2024-12-26 17:17:07
42岁车晓带父亲看中医,车晓彤已满头白发,脸部浮肿,另娶小娇妻

42岁车晓带父亲看中医,车晓彤已满头白发,脸部浮肿,另娶小娇妻

观察鉴娱
2024-12-19 14:05:23
吴柳芳遭处罚!管晨辰被骂破防:开启一键防护 微博账号搜索不到

吴柳芳遭处罚!管晨辰被骂破防:开启一键防护 微博账号搜索不到

念洲
2024-12-25 09:23:32
代价6:太子辉救下小悦和小丽

代价6:太子辉救下小悦和小丽

金昔说故事
2024-12-26 22:40:56
12岁少年坐同伴电动车遇车祸身亡,家属获赔27万元

12岁少年坐同伴电动车遇车祸身亡,家属获赔27万元

现代快报
2024-12-26 12:43:04
太离谱了!阿娇和阿sa完全不在意身材管理啊,胖成球

太离谱了!阿娇和阿sa完全不在意身材管理啊,胖成球

西楼知趣杂谈
2024-11-23 11:23:19
事出反常必有妖!今年灌腊肠的人特别少,也不知道是怎么回事

事出反常必有妖!今年灌腊肠的人特别少,也不知道是怎么回事

猫小狸同学
2024-12-21 20:00:02
东京夺冠,黑龙江奖励100万豪宅,时隔3年,王曼昱豪宅增值多少?

东京夺冠,黑龙江奖励100万豪宅,时隔3年,王曼昱豪宅增值多少?

东球弟
2024-12-25 16:18:30
年运 | Alex 12星座2025年年度运势(完整版)

年运 | Alex 12星座2025年年度运势(完整版)

Alex大叔
2024-12-25 18:07:10
越扒越可怕!海南飞行员失踪后续,网友:与两年前的案子惊人相似

越扒越可怕!海南飞行员失踪后续,网友:与两年前的案子惊人相似

观察鉴娱
2024-12-26 10:42:10
医院中最残忍的事情是什么?网友:才四十七岁,就被老公拔了管子

医院中最残忍的事情是什么?网友:才四十七岁,就被老公拔了管子

奇特短尾矮袋鼠
2024-08-12 19:26:04
看谁敢动台湾一下!美下令,“大鱼”全来了,解放军做好最坏准备

看谁敢动台湾一下!美下令,“大鱼”全来了,解放军做好最坏准备

听风者说
2024-12-25 21:12:50
也门两地传出爆炸声!胡塞武装称遭以色列空袭,以总理曾威胁:要给胡塞“上一课”

也门两地传出爆炸声!胡塞武装称遭以色列空袭,以总理曾威胁:要给胡塞“上一课”

每日经济新闻
2024-12-26 22:31:08
2024-12-27 02:40:49
AI科技评论 incentive-icons
AI科技评论
点评学术,服务AI
6701文章数 20628关注度
往期回顾 全部

科技要闻

小米正搭建GPU万卡集群,大力投入AI大模型

头条要闻

阿航客机失事现场找到第二个黑匣子

头条要闻

阿航客机失事现场找到第二个黑匣子

体育要闻

再见,中超最后的超级巨星

娱乐要闻

57岁王祖贤分享近照,状态太好又被质疑整容

财经要闻

69亿订单"消失",卓然股份隐藏了什么?

汽车要闻

新物种iCAR V23的“尤里卡时刻”

态度原创

教育
亲子
时尚
数码
军事航空

教育要闻

真心建议文科生都去做这三件事别卷学历了

亲子要闻

济南60岁孕妇产子后续!街道回应:二胎,大女儿34岁。评论区炸锅

今年最好看的搭配竟然是基础款?这样穿高级又时髦

数码要闻

NVIDIA与AMD急于出货下一代GPU以规避特朗普上台后的关税

军事要闻

中方批菲防长涉华言论出格荒唐

无障碍浏览 进入关怀版