网易首页 > 网易号 > 正文 申请入驻

AI:你总要高清视频,它来了

0
分享至

机器之心报道

机器之心编辑部

以后,就算是跑着拍视频,FMA-Net也能给你处理得非常满意。

Magnific 图像超分 & 增强工具还正在火热体验中,它强大的图像升频与再创能力收获一致好评。现在,视频领域也有了自己的 Magnific。

拍摄的街道视频一片模糊,仿佛高度近视没戴眼镜一样:

与之相比,下面的视频清晰度高了很多:

视频画面两边形成鲜明的对比:左边视频已经模糊的看不清人脸,而右边视频建筑物的纹理也看得清清楚楚:

行驶的汽车仿佛从一个模糊的世界穿越到高清世界:

不同的方法进行比较,明显看到右下角的视频在微小的细节恢复方面更加清晰:

通过上述展示,我们可以看出,视频超分辨率(VSR)就像是给模糊的老电影穿上了高清新衣。比如上面展示的一段道路监控录像,由于画质太低,细节看起来像是被涂抹过一样。这时候就需要 VSR 技术出场了,它能够把这些低分辨率的视频变得更加清晰。

不过,这个过程并不简单。常常因为摄像机晃动或拍摄物体的移动,视频就像是被风吹过的湖面,波纹模糊。这时,我们不仅需要提升视频的清晰度,还得「摆平」这些模糊的干扰。这就需要视频超分辨率和去模糊的联合修复(VSRDB),它要在保持视频清晰度的同时,还得处理模糊,确保最后呈现出来的视频既清晰又流畅。

为了实现上述效果,来自韩国科学技术院(KAIST)与中央大学的研究者们提出了 FMA-Net 框架。这个框架基于流引导的动态滤波(Flow-Guided Dynamic Filtering, FGDF)和迭代特征细化的多重注意力机制(Iterative Feature Refinement with Multi-Attention, FRMA),旨在实现从小到大的运动表示学习,并具有良好的联合恢复性能(见图 1)。FGDF 的关键之处在于执行滤波时要注意运动轨迹,而不是拘泥于固定位置,这样就能用较小的核有效处理较大的运动。

  • 论文地址:https://arxiv.org/abs/2401.03707
  • 项目主页:http://kaist-viclab.github.io/fmanet-site/
  • 论文标题:FMA-Net: Flow-Guided Dynamic Filtering and Iterative Feature Refinement with Multi-Attention for Joint Video Super-Resolution and Deblurring

方法介绍

该研究的目标是同时实现视频超分辨率和去模糊(VSRDB)。对于一个模糊的 LR(低分辨率, low-resolution )输入序列,式中 T = 2N + 1、c 分别表示输入帧数和中心帧索引。VSRDB 的目标是预测一个清晰的 HR( 高分辨率,high-resolution )中心框架。如下图展示了 VSRDB 框架 FMA-Net。

FMA-Net 包括两部分:退化学习网络 Net^D ;修复网络 Net^R 。退化学习网络用于估计感知运动的时空变化退化核;修复网络利用这些预测出的退化核来恢复模糊的低分辨率视频。

其中,退化学习网络 Net^D 用来预测运动感知的时空变化退化,而 Net^R 以全局自适应的方式利用 Net^D 预测的退化来恢复中心帧 X_c。

Net^D 和 Net^R 具有相似的结构,它们由 FRMA( feature refinement with multiattention )块和 FGDF( flow-guided dynamic filtering )块组成。

下图 4 (a) 显示了第 (i+1) 步更新时 FRMA 块的结构,图 4 (b) 为多注意力结构。

下图 2 展示了 FGDF 概念。FGDF 看起来类似于可变形卷积(DCN),但不同之处在于 FGDF 学习的是位置相关的 n×n 动态滤波器系数,而 DCN 学习的是位置不变的 n×n 滤波器系数。

此外,新提出的多注意力机制,包括以中心为导向的注意力和退化感知注意力,使得 FMA-Net 能够专注于目标帧,并以全局适应的方式使用退化核进行视频超分辨率和去模糊。

训练策略

该研究采用两阶段的训练策略来训练 FMA-Net。首先对 Net^D 进行预训练,损失 L_D 为:

然后,为了提高性能,本文还提出了 TA 损失,即等式右侧的最后一项。

总的训练损失为:

实验结果

表 1 显示了在测试集 REDS4 上的定量比较结果。从表 1 可以看出:

  • 级联 SR 和去模糊的序列方法会导致先前模型的错误传播,导致性能显著下降,并且使用两个模型还会增加内存和运行时成本;
  • 与序列级联方法相比,VSRDB 方法始终表现出优越的整体性能,表明这两个任务高度相关;
  • FMA-Net 在 PSNR、SSIM 和 tOF 方面显著优于所有 SOTA 方法,具体来说,FMA-Net 比 SOTA 算法 RVRT * 和 BasicVSR++* 分别提高了 1.03 dB 和 1.77 dB。

表 2 为定量比较结果。当对两个测试集进行平均时,FMA-Net 的性能分别比 RVRT * 和 GShiftNet * 提高了 2.08 dB 和 1.93 dB。

下图为不同方法对 ×4 VSRDB 的可视化比较结果,表明 FMA-Net 生成的图像比其他方法生成的图像在视觉上更清晰。

不同方法在 REDS4、GoPro 和 YouTube 测试集上的可视化结果。放大观看效果最好。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
韩国股市巨震:跌停熔断→翻红!

韩国股市巨震:跌停熔断→翻红!

证券时报
2026-05-18 11:04:05
俄方大军压境,泽连斯基绝望求救,俄外交部回应:先去算算命

俄方大军压境,泽连斯基绝望求救,俄外交部回应:先去算算命

启迪你的思维
2026-05-18 22:18:09
今日最惨股:8只直线跳水跌停,其中1只从涨停闪崩到跌停!

今日最惨股:8只直线跳水跌停,其中1只从涨停闪崩到跌停!

丁丁鲤史纪
2026-05-18 17:57:09
苦等20年,杨紫终于让所有人闭嘴!张一山那句土味情话成预言

苦等20年,杨紫终于让所有人闭嘴!张一山那句土味情话成预言

一盅情怀
2026-04-14 14:23:21
迷倒卢比奥,震撼马斯克,100张图看大会堂内部,不为人知故事…

迷倒卢比奥,震撼马斯克,100张图看大会堂内部,不为人知故事…

华人星光
2026-05-17 12:11:53
梦鸽李天一赴美不归?看到85岁李双江“现状”,原来杨洪基没说谎

梦鸽李天一赴美不归?看到85岁李双江“现状”,原来杨洪基没说谎

阿纂看事
2024-11-05 11:54:58
美国2架战机飞行表演时空中相撞坠毁,4名机组人员弹射逃生,现场浓烟滚滚

美国2架战机飞行表演时空中相撞坠毁,4名机组人员弹射逃生,现场浓烟滚滚

鲁中晨报
2026-05-18 07:06:05
笑死!原来大佬的推荐信只需要几个字,网友:一字千金

笑死!原来大佬的推荐信只需要几个字,网友:一字千金

另子维爱读史
2026-04-15 20:37:30
中国又收回一块领土,被霸占70年,如今3560人全部加入中国籍!

中国又收回一块领土,被霸占70年,如今3560人全部加入中国籍!

浩渺青史
2026-05-10 19:16:50
300983,股价跳水,多家外资重仓!特种光纤价格暴涨10倍,概念龙头获融资客抢筹

300983,股价跳水,多家外资重仓!特种光纤价格暴涨10倍,概念龙头获融资客抢筹

数据宝
2026-05-18 12:11:42
正部级王晓东被查:40岁成为副省级干部,曾担任湖北省省长

正部级王晓东被查:40岁成为副省级干部,曾担任湖北省省长

界面新闻
2026-05-17 19:15:02
25分钟23+5三分!848万梅里尔创4纪录成奇兵 休媒:我们想要他

25分钟23+5三分!848万梅里尔创4纪录成奇兵 休媒:我们想要他

颜小白的篮球梦
2026-05-18 11:08:57
特朗普警告伊朗“时钟正滴答作响”

特朗普警告伊朗“时钟正滴答作响”

新华社
2026-05-18 11:49:11
善恶有报,移居英国仅2年,57岁吴秀波再迎噩耗,步入李易峰后尘

善恶有报,移居英国仅2年,57岁吴秀波再迎噩耗,步入李易峰后尘

有范又有料
2025-12-17 14:54:06
莫雷高德感谢樊振东!中国球迷为我助威,勒布伦:交手是一种荣幸

莫雷高德感谢樊振东!中国球迷为我助威,勒布伦:交手是一种荣幸

排球黄金眼
2026-05-18 16:59:52
价格战又起,携号转网39元包1000M宽带+90G流量!你们就卷吧

价格战又起,携号转网39元包1000M宽带+90G流量!你们就卷吧

通信老柳
2026-05-17 09:02:01
阿隆索入主切尔西:五笔引援助力斯坦福桥重建?

阿隆索入主切尔西:五笔引援助力斯坦福桥重建?

乐道足球C
2026-05-18 15:54:12
为什么欧美人不炒菜,只有中国有?美国教授:中国活在原始时代

为什么欧美人不炒菜,只有中国有?美国教授:中国活在原始时代

抽象派大师
2026-05-17 02:08:19
全线大跌,超10万人爆仓

全线大跌,超10万人爆仓

新浪财经
2026-05-18 12:56:24
媒体人:广厦攻防两端都太稳了,深圳人员短缺却足够顽强

媒体人:广厦攻防两端都太稳了,深圳人员短缺却足够顽强

懂球帝
2026-05-18 22:12:40
2026-05-18 23:40:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
13027文章数 142650关注度
往期回顾 全部

科技要闻

同一公司,有人奖金是6年工资,我却只有半年

头条要闻

赖清德要求美国继续向台出售武器 外交部表态

头条要闻

赖清德要求美国继续向台出售武器 外交部表态

体育要闻

58顺位的保罗,最强第三中锋

娱乐要闻

票房会破14亿!口碑第一电影出现了

财经要闻

中国芯片,怎么突然不便宜了?

汽车要闻

归元S平台首款车型 魏牌V9X上市 34.98万元起

态度原创

健康
数码
房产
公开课
军事航空

专家揭秘干细胞回输的安全风险

数码要闻

索尼十周年纪念耳机The ColleXion曝光 设计全面奢华升级

房产要闻

突发!海口重磅调规!碧桂园要解套;新埠岛要起飞了!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

莫斯科遭一年多来最大规模无人机袭击 3死18伤

无障碍浏览 进入关怀版