网易首页 > 网易号 > 正文 申请入驻

ICCV 2021 | UCLA提出:基于张量CUR的快速鲁棒张量主成分分析算法

0
分享至

作者 | HanQin Cai, Zehan Chao, Longxiu Huang

编辑 | 王晔

本文是对发表于国际计算机视觉大会ICCV的Workshop论文“Fast Robust Tensor Principal Component Analysis via Fiber CUR Decomposition”[1] 的介绍。

该论文由UCLA大学数学系HanQin Cai, Zehan Chao, Longxiu Huang, and Deanna Needell共同完成。

论文arXiv链接:https://arxiv.org/abs/2108.10448

1

研究简介

我们的研究主要是关于鲁棒张量主成分分析的算法,也可以称作鲁棒张量分解算法。与传统的高维奇异值分解算法(HOSVD)不同,我们的算法是基于【张量CUR分解】【交替映射法】衍生出的关于张量分解的一套算法。解决同样的张量问题有非常大的时间复杂度优势,同时也不会受限于被稀疏离群值 (sparse outlier)破坏的数据。我们通过大量的模拟数据实验与真实数据实验来验证了算法的可行性与鲁棒性。

2

研究背景

主成分分析(PCA)是一种基础的数学分析方法,为对多变量数据进行降维以便更好的分析及可视化。矩阵数据的PCA通常与矩阵分解密切相关,例如一种常见的PCA问题定义为获得矩阵的低秩趋近:

这个问题可以通过矩阵的截断奇异值分解(truncated SVD)来完成。

传统的PCA存在一些公认的缺点,例如对于离群值非常敏感,少数几个离群值会完全扰乱算法的输出。因此在这之上一些研究转向了鲁棒主成分分析 (Robust PCA、RPCA)。RPCA在PCA的基础上增加了对于稀疏离群值的容忍度:

此处,额外的稀疏矩阵S吸收原数据D的离群值,从而使得输出结果L更加鲁棒。

张量(Tensor)是比矩阵更广义的结构,可以看作多维度版本的矩阵;同样,矩阵可以定义为二维的张量。在各种关于数据科学的研究中,张量被认为可以比矩阵更好地保存原数据的结构,从而产生了各类对张量的研究。其中,张量的鲁棒主成分分析,即鲁棒分解问题,就是我们算法处理的主要问题。即:

注意,张量的秩存在多种不同的定义。在此文中,我们着重研究张量的多线性秩(multilinear rank),也称为塔克秩 (Tucker rank)

3

方法介绍

最初的CUR分解属于矩阵分解的一种,与LU分解,SVD分解类似:

其中,C指的是原矩阵提取的列,R指的是原矩阵提取的行,U 是 C和R的交叉部分。CUR分解总是成立的当U的秩等于A的秩(详细内容可参考论文[2])。

将这个概念拓展到高维张量里,我们就有了张量版本的CUR分解(张量CUR有Chidori CUR和 Fiber CUR两个版本,本文使用Fiber CUR。详细内容可参考论文[3])

在此之上,结合交替映射算法的概念,我们开发了称之为鲁棒张量CUR (Robust Tensor CUR、RTCUR)的算法:

其中,第5行的resample是可以在每个迭代中进行也可以始终统一,进而演化成了两种算法,RTCUR-R与RTCUR-F。这两种算法的区别在于,Resample的算法(RTCUR-R)在处理更密的离群值数据时比Fixed index算法(RTCUR-F)要稳定一些,但RTCUR-F算法因为每次迭代中不用重新选择张量中的数据,在运行时间上稍有优势,以及RTCUR-F只需要取原张量中非常小的一部分数据,从而对数据缺失有更高的容忍度。

4

实验结果

首先,我们研究RTCUR算法的采样系数(Sampling Constant)与离群值密度的相变图。我们生成固定秩的三维张量,然后加入不同密度的离群值,运行不同采样系数RTCUR算法进行检测。从而根据RTCUR算法是否可以准确恢复原低秩张量L来画出如下相变图:

从相变图中可以看到,在采样系数取在3~5之间时,我们可以获得较高的离群值容忍度同时保持算法的较快运行。

接着,我们生成了不同尺寸的低秩三维张量和随机稀疏离群值来测试各种算法的运行时间与结果准确性。实验结果发现,基本所有的算法对于 20%的离群值都可以准确地分离出低秩部分与稀疏离群值部分。从时间对比图上也可以看到处理张量鲁棒分解问题时,RTCUR拥有巨大的时间优势:

我们又测试了不同的真实数据集,其中一项任务是彩色视频的背景分离。比如在一段行人走在街上的视频,彩色的低秩背景街道可以视为张量, 而移动中的行人则可视为离群值。通过几段不同的视频测试,我们的RTCUR算法都可以获得很好的分离效果:

当然,不同算法的效果略有差异,但总体都成功的分离了背景与前景。在这之上,RTCUR算法对于真实数据同样有明显的时间优势(见Table 1)。

5

总结

本文针对张量鲁棒主成分分析问题提出了一个基于张量CUR的快速算法。从模拟数据和真实数据来看,我们的算法在准确有效的同时极大地提升了速度。我们未来会在算法的理论方面探讨一些思路和可能性。

期刊扩展版会很快推出,欢迎大家关注我们后续的工作。

参考文献

[1] H.Q. Cai, Z. Chao, L. Huang, and D. Needell. Fast Robust Tensor Principal Component Analysis via Fiber CUR Decomposition. International Conference on Computer Vision (ICCV) Workshop on Robust Subspace Learning and Applications in Computer Vision, 2021.

[2] K. Hamm and L. Huang. Perspectives on CUR decompositions. Applied and Computational Harmonic Analysis (ACHA), 48(3): 1088-1099, 2020.

[3] H.Q. Cai, K. Hamm, L. Huang, and D. Needell. Mode-wise Tensor Decompositions: Multi-dimensional Generalizations of CUR Decompositions. Journal of Machine Learning Research (JMLR), 22(185):1-36, 2021.

[4] C. Lu, J. Feng, Y. Chen, W. Liu, Z. Lin, and S. Yan, Tensor robust principal component analysis with a new tensor nuclear norm, IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 42(4): 925–938, 2019.

[5] H.Q. Cai, J. Cai, and K. Wei. Accelerated Alternating Projections for Robust Principal Component Analysis. Journal of Machine Learning Research (JMLR), 20(20): 1-33, 2019.

[6] H.Q. Cai, K. Hamm, L. Huang, J. Li and T. Wang. Rapid Robust Principal Component Analysis: CUR Accelerated Inexact Low Rank Estimation. IEEE Signal Processing Letters (IEEE SPL), 28: 116-120, 2020.

扫码添加小助手微信(AIyanxishe3),备注ICCV2021拉你进群。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美国天文学家惊人推测:外星飞船11月将袭击地球,根本无法拦截……

美国天文学家惊人推测:外星飞船11月将袭击地球,根本无法拦截……

果壳
2025-07-29 21:04:28
北京暴雨致30人死亡!密云受灾严重,有小区被积水淹没了一层楼…

北京暴雨致30人死亡!密云受灾严重,有小区被积水淹没了一层楼…

火山诗话
2025-07-29 07:12:39
特朗普访华定了,已将重要投名状递给中方,佩洛西:又让中国赢了

特朗普访华定了,已将重要投名状递给中方,佩洛西:又让中国赢了

爱下厨的阿酾
2025-07-29 11:45:35
吃相难看?岳云鹏开演唱会仅2天,令人恶心一幕曝光,被网友逼捐

吃相难看?岳云鹏开演唱会仅2天,令人恶心一幕曝光,被网友逼捐

山河月明史
2025-07-29 18:16:32
51岁董事长兼总裁被留置,完成“接棒”不到1年,公司股价大跌

51岁董事长兼总裁被留置,完成“接棒”不到1年,公司股价大跌

红星资本局
2025-07-29 17:18:21
解密少林寺新住持:20年白马寺方丈,曾表示“不评价少林寺商业化”

解密少林寺新住持:20年白马寺方丈,曾表示“不评价少林寺商业化”

时代周报
2025-07-29 21:30:22
炸裂!女子收留19岁外甥女吃住在家,不料与丈夫发生关系还怀了孕

炸裂!女子收留19岁外甥女吃住在家,不料与丈夫发生关系还怀了孕

天天热点见闻
2025-07-29 17:07:31
花和尚释永信塌房后续:多名情人被扒,后台很硬,资产已转移国外

花和尚释永信塌房后续:多名情人被扒,后台很硬,资产已转移国外

吭哧有力
2025-07-28 11:46:04
中美确认泰柬停火后,洪森感谢特朗普,佩通坦暂渡危机,赢得好感

中美确认泰柬停火后,洪森感谢特朗普,佩通坦暂渡危机,赢得好感

小企鹅侃世界
2025-07-29 12:38:49
刚出狱就带全家出国潇洒,坐头等舱吃大龙虾,前主持人陈维聪火了

刚出狱就带全家出国潇洒,坐头等舱吃大龙虾,前主持人陈维聪火了

揽星河的笔记
2025-07-29 18:18:18
三个小孩卖冰棍 顾客吃了不付钱 目击者称:冰棍箱里只有两支冰棍 客人非要吃完第三支才付钱 当地回应:孩子报警后顾客已付钱

三个小孩卖冰棍 顾客吃了不付钱 目击者称:冰棍箱里只有两支冰棍 客人非要吃完第三支才付钱 当地回应:孩子报警后顾客已付钱

闪电新闻
2025-07-29 17:25:09
索尼在美国起诉腾讯游戏抄袭! 大量雷同高度相似

索尼在美国起诉腾讯游戏抄袭! 大量雷同高度相似

游民星空
2025-07-29 11:05:48
美关税大棒即将落下,目前最受伤的是这5个,俄称美对俄关税无效

美关税大棒即将落下,目前最受伤的是这5个,俄称美对俄关税无效

战友老邓
2025-07-29 14:58:43
怀特谈被交易:当时我满脑子想的都是他们为什么不要我了

怀特谈被交易:当时我满脑子想的都是他们为什么不要我了

直播吧
2025-07-29 23:08:58
消息称释永信是周五深夜被“叫走”的 年初访问回国即被限制出境被谈话

消息称释永信是周五深夜被“叫走”的 年初访问回国即被限制出境被谈话

小星球探索
2025-07-28 11:19:33
女子谈释永信过往,她们姐妹住少林寺3天2夜,争着往释永信房间跑

女子谈释永信过往,她们姐妹住少林寺3天2夜,争着往释永信房间跑

江山挥笔
2025-07-29 16:50:59
就是这个眼神,看得我腰酸背痛!

就是这个眼神,看得我腰酸背痛!

贵圈真乱
2025-07-29 10:25:11
普京签署一体化法案!俄白一旦合并,卢卡申科想当富家翁都很困难

普京签署一体化法案!俄白一旦合并,卢卡申科想当富家翁都很困难

鹰眼Defence
2025-07-29 18:22:36
爆大冷!世界冠军无缘领奖台,中国游泳2连败,世锦赛惨遭滑铁卢

爆大冷!世界冠军无缘领奖台,中国游泳2连败,世锦赛惨遭滑铁卢

削桐作琴
2025-07-29 19:38:35
只谈了不到3小时,泰柬为何能“闪电停火”?

只谈了不到3小时,泰柬为何能“闪电停火”?

环球网资讯
2025-07-29 17:23:23
2025-07-30 04:12:49
AI科技评论 incentive-icons
AI科技评论
点评学术,服务AI
6893文章数 20677关注度
往期回顾 全部

科技要闻

理想i8售价公布:32.18万-36.98万元

头条要闻

解密少林寺新住持:20年白马寺方丈 拒评价少林寺商业化

体育要闻

巅峰身价9000万,他在30岁告别五大联赛

娱乐要闻

小S被曝十月回归!复出全靠大S热度?

财经要闻

吴晓求解读稳定币:只是货币功能的延伸

汽车要闻

新势力能给的一次补齐 全新坦克500满配智能大升级

态度原创

教育
健康
时尚
数码
房产

教育要闻

教育部办公厅关于组织开展第三届全国中小学班主任基本功和思政课教师教学基本功展示交流活动的通知

呼吸科专家破解呼吸道九大谣言!

夏天别总穿黑衣黑裤,还可以试试这些印花单品,高级有回头率

数码要闻

Bragi 与 OpenAI 合作推出 ChatAI 应用,为耳机装上 GPT-4.1

房产要闻

千亿巨头再出手!海口楼市下一个爆点,出现了!