网易首页 > 网易号 > 正文 申请入驻

ICCV 2021 | UCLA提出:基于张量CUR的快速鲁棒张量主成分分析算法

0
分享至

作者 | HanQin Cai, Zehan Chao, Longxiu Huang

编辑 | 王晔

本文是对发表于国际计算机视觉大会ICCV的Workshop论文“Fast Robust Tensor Principal Component Analysis via Fiber CUR Decomposition”[1] 的介绍。

该论文由UCLA大学数学系HanQin Cai, Zehan Chao, Longxiu Huang, and Deanna Needell共同完成。

论文arXiv链接:https://arxiv.org/abs/2108.10448

1

研究简介

我们的研究主要是关于鲁棒张量主成分分析的算法,也可以称作鲁棒张量分解算法。与传统的高维奇异值分解算法(HOSVD)不同,我们的算法是基于【张量CUR分解】【交替映射法】衍生出的关于张量分解的一套算法。解决同样的张量问题有非常大的时间复杂度优势,同时也不会受限于被稀疏离群值 (sparse outlier)破坏的数据。我们通过大量的模拟数据实验与真实数据实验来验证了算法的可行性与鲁棒性。

2

研究背景

主成分分析(PCA)是一种基础的数学分析方法,为对多变量数据进行降维以便更好的分析及可视化。矩阵数据的PCA通常与矩阵分解密切相关,例如一种常见的PCA问题定义为获得矩阵的低秩趋近:

这个问题可以通过矩阵的截断奇异值分解(truncated SVD)来完成。

传统的PCA存在一些公认的缺点,例如对于离群值非常敏感,少数几个离群值会完全扰乱算法的输出。因此在这之上一些研究转向了鲁棒主成分分析 (Robust PCA、RPCA)。RPCA在PCA的基础上增加了对于稀疏离群值的容忍度:

此处,额外的稀疏矩阵S吸收原数据D的离群值,从而使得输出结果L更加鲁棒。

张量(Tensor)是比矩阵更广义的结构,可以看作多维度版本的矩阵;同样,矩阵可以定义为二维的张量。在各种关于数据科学的研究中,张量被认为可以比矩阵更好地保存原数据的结构,从而产生了各类对张量的研究。其中,张量的鲁棒主成分分析,即鲁棒分解问题,就是我们算法处理的主要问题。即:

注意,张量的秩存在多种不同的定义。在此文中,我们着重研究张量的多线性秩(multilinear rank),也称为塔克秩 (Tucker rank)

3

方法介绍

最初的CUR分解属于矩阵分解的一种,与LU分解,SVD分解类似:

其中,C指的是原矩阵提取的列,R指的是原矩阵提取的行,U 是 C和R的交叉部分。CUR分解总是成立的当U的秩等于A的秩(详细内容可参考论文[2])。

将这个概念拓展到高维张量里,我们就有了张量版本的CUR分解(张量CUR有Chidori CUR和 Fiber CUR两个版本,本文使用Fiber CUR。详细内容可参考论文[3])

在此之上,结合交替映射算法的概念,我们开发了称之为鲁棒张量CUR (Robust Tensor CUR、RTCUR)的算法:

其中,第5行的resample是可以在每个迭代中进行也可以始终统一,进而演化成了两种算法,RTCUR-R与RTCUR-F。这两种算法的区别在于,Resample的算法(RTCUR-R)在处理更密的离群值数据时比Fixed index算法(RTCUR-F)要稳定一些,但RTCUR-F算法因为每次迭代中不用重新选择张量中的数据,在运行时间上稍有优势,以及RTCUR-F只需要取原张量中非常小的一部分数据,从而对数据缺失有更高的容忍度。

4

实验结果

首先,我们研究RTCUR算法的采样系数(Sampling Constant)与离群值密度的相变图。我们生成固定秩的三维张量,然后加入不同密度的离群值,运行不同采样系数RTCUR算法进行检测。从而根据RTCUR算法是否可以准确恢复原低秩张量L来画出如下相变图:

从相变图中可以看到,在采样系数取在3~5之间时,我们可以获得较高的离群值容忍度同时保持算法的较快运行。

接着,我们生成了不同尺寸的低秩三维张量和随机稀疏离群值来测试各种算法的运行时间与结果准确性。实验结果发现,基本所有的算法对于 20%的离群值都可以准确地分离出低秩部分与稀疏离群值部分。从时间对比图上也可以看到处理张量鲁棒分解问题时,RTCUR拥有巨大的时间优势:

我们又测试了不同的真实数据集,其中一项任务是彩色视频的背景分离。比如在一段行人走在街上的视频,彩色的低秩背景街道可以视为张量, 而移动中的行人则可视为离群值。通过几段不同的视频测试,我们的RTCUR算法都可以获得很好的分离效果:

当然,不同算法的效果略有差异,但总体都成功的分离了背景与前景。在这之上,RTCUR算法对于真实数据同样有明显的时间优势(见Table 1)。

5

总结

本文针对张量鲁棒主成分分析问题提出了一个基于张量CUR的快速算法。从模拟数据和真实数据来看,我们的算法在准确有效的同时极大地提升了速度。我们未来会在算法的理论方面探讨一些思路和可能性。

期刊扩展版会很快推出,欢迎大家关注我们后续的工作。

参考文献

[1] H.Q. Cai, Z. Chao, L. Huang, and D. Needell. Fast Robust Tensor Principal Component Analysis via Fiber CUR Decomposition. International Conference on Computer Vision (ICCV) Workshop on Robust Subspace Learning and Applications in Computer Vision, 2021.

[2] K. Hamm and L. Huang. Perspectives on CUR decompositions. Applied and Computational Harmonic Analysis (ACHA), 48(3): 1088-1099, 2020.

[3] H.Q. Cai, K. Hamm, L. Huang, and D. Needell. Mode-wise Tensor Decompositions: Multi-dimensional Generalizations of CUR Decompositions. Journal of Machine Learning Research (JMLR), 22(185):1-36, 2021.

[4] C. Lu, J. Feng, Y. Chen, W. Liu, Z. Lin, and S. Yan, Tensor robust principal component analysis with a new tensor nuclear norm, IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 42(4): 925–938, 2019.

[5] H.Q. Cai, J. Cai, and K. Wei. Accelerated Alternating Projections for Robust Principal Component Analysis. Journal of Machine Learning Research (JMLR), 20(20): 1-33, 2019.

[6] H.Q. Cai, K. Hamm, L. Huang, J. Li and T. Wang. Rapid Robust Principal Component Analysis: CUR Accelerated Inexact Low Rank Estimation. IEEE Signal Processing Letters (IEEE SPL), 28: 116-120, 2020.

扫码添加小助手微信(AIyanxishe3),备注ICCV2021拉你进群。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
杭州灵隐寺,为何要保留“一代妖僧”的雕像?看到千万不要乱拜

杭州灵隐寺,为何要保留“一代妖僧”的雕像?看到千万不要乱拜

收藏大视界
2026-02-28 23:03:27
特朗普称同意与伊朗新领导层对话

特朗普称同意与伊朗新领导层对话

每日经济新闻
2026-03-02 08:17:27
特朗普怎么都没想到,哈梅内伊生前最后一项安排,让美以进退两难

特朗普怎么都没想到,哈梅内伊生前最后一项安排,让美以进退两难

蓝色海边
2026-03-03 00:27:07
国际原子能机构总干事表示未发现伊朗核武制造计划

国际原子能机构总干事表示未发现伊朗核武制造计划

财联社
2026-03-03 00:37:09
救命,国产烂片又刷新下限了

救命,国产烂片又刷新下限了

喵喵娱乐团
2026-02-28 16:41:47
凌晨浦东机场:四女孩险飞泰国,两分钟之差险酿悲剧

凌晨浦东机场:四女孩险飞泰国,两分钟之差险酿悲剧

刘拕说体坛
2026-03-02 09:03:39
2月车市,再给新能源汽车泼一大盆冷水,凉透了

2月车市,再给新能源汽车泼一大盆冷水,凉透了

互联网.乱侃秀
2026-03-02 10:06:29
华国锋担任中央主席时,中央先后任命了15位开国将帅辅佐他

华国锋担任中央主席时,中央先后任命了15位开国将帅辅佐他

雍亲王府
2026-03-02 15:55:03
欠中国的钱,委内瑞拉不还了?美财长:中国已无法继续获得委石油

欠中国的钱,委内瑞拉不还了?美财长:中国已无法继续获得委石油

萌城少年强
2026-01-22 12:47:40
伊朗战事升级,对中国5大产业影响深远,普通人别只看热闹

伊朗战事升级,对中国5大产业影响深远,普通人别只看热闹

触摸史迹
2026-03-02 21:14:00
向美国捐8亿被骂叛徒!无锡唐氏21代掌门:我的钱只认文明归属

向美国捐8亿被骂叛徒!无锡唐氏21代掌门:我的钱只认文明归属

谈史论天地
2026-02-10 08:16:24
白忙活了?特朗普万万没想到,哈梅内伊殉职后,伊朗军队没人叛逃

白忙活了?特朗普万万没想到,哈梅内伊殉职后,伊朗军队没人叛逃

楠楠自语
2026-03-02 22:31:05
这个死磕王楚钦的裁判,决赛就没让她上场

这个死磕王楚钦的裁判,决赛就没让她上场

杨仔述
2026-03-02 11:13:02
人可以狠心到什么程度?看网友讲述,发现我真做不到这般绝

人可以狠心到什么程度?看网友讲述,发现我真做不到这般绝

侃神评故事
2026-02-27 07:40:03
回顾:女硕士被丈夫用拖鞋拍死,生前求饶2小时:我怀着你的弟弟

回顾:女硕士被丈夫用拖鞋拍死,生前求饶2小时:我怀着你的弟弟

谈史论天地
2026-03-02 13:11:55
法国和浙江同为6000万人口,2025年法国创3万亿美元GDP,浙江呢?

法国和浙江同为6000万人口,2025年法国创3万亿美元GDP,浙江呢?

八斗小先生
2026-02-28 18:56:17
历史性转折!黎巴嫩正式清场真主党,中东格局一夜改写

历史性转折!黎巴嫩正式清场真主党,中东格局一夜改写

老马拉车莫少装
2026-03-02 23:27:10
550亿美元砸进炮火:一场工业体系的极限对冲

550亿美元砸进炮火:一场工业体系的极限对冲

七分日记
2026-02-26 23:01:48
真香预警 低价MacBook性价比无敌!降维打击Windows、等等党最终归宿

真香预警 低价MacBook性价比无敌!降维打击Windows、等等党最终归宿

快科技
2026-03-02 10:50:12
内贾德遇害细节公布,家中遭毒手,本人和保镖双双殒命?

内贾德遇害细节公布,家中遭毒手,本人和保镖双双殒命?

小影的娱乐
2026-03-03 00:46:39
2026-03-03 01:56:49
AI科技评论 incentive-icons
AI科技评论
点评学术,服务AI
7099文章数 20733关注度
往期回顾 全部

科技要闻

苹果中国官网上线iPhone 17e,4499元起

头条要闻

中国留学生:很多人得知哈梅内伊身亡后 决定尽快撤离

头条要闻

中国留学生:很多人得知哈梅内伊身亡后 决定尽快撤离

体育要闻

“想要我签名吗” 梅西逆转后嘲讽对手主帅

娱乐要闻

李亚鹏与哥哥和解 只有一条真心话短信

财经要闻

油价飙升 美伊冲突将如何搅动全球经济

汽车要闻

国民SUV再添一员 瑞虎7L静态体验

态度原创

房产
教育
健康
公开课
军事航空

房产要闻

方案突然曝光!海口北师大附校,又有书包大盘杀出!

教育要闻

特别猛,但在留学生心中存在感很低的英国大学!

转头就晕的耳石症,能开车上班吗?

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美国中央司令部透露对伊朗动武全部武器装备清单

无障碍浏览 进入关怀版