网易首页 > 网易号 > 正文 申请入驻

Masked Autoencoders Are Scalable Vision Learners 论文导读

0
分享至

Facebook 人工智能研究 (FAIR) 团队发表的论文 Masked Autoencoders Are Scalable Vision Learners 已成为计算机视觉社区的热门话题。这也是KaiMing大神在2年后的第一篇一作论文。

采用带有掩码的语言建模系统,如谷歌的 BERT 及其自回归对应物,如 OpenAI 的 GPT,已经在自然语言处理 (NLP) 任务中取得了惊人的性能,并能够训练包含超过 1000 亿个参数的泛化 NLP 模型。

但是在计算机视觉中自编码方法的进展和性能远远落后于它们在 NLP 能力。 一个问题自然会出现:掩码自动编码在视觉和语言领域有何不同? FAIR 论文解决了这个问题,并证明了 Masked Autoencoders (MAE) 可以是用于计算机视觉的可扩展自监督学习器。

研究人员首先讨论了视觉和语言领域中带有掩码的自编码器的差异,总结为以下三点:1) 到现在为止两者架构还是不同的; 2)语言和图像的信息密度不同; 3)自动编码器的解码器将潜在表示映射回输入,在重建文本或图像时扮演不同的角色。

然后,该论文提出了一种简单、有效且可扩展的 用于视觉表示学习的MAE方法。所提出的 MAE 方法背后的想法很简单——将来自输入图像的随机块被屏蔽,然后在像素空间中重建丢失的块。该团队将其 MAE 的双核心设计和方法总结为:

我们开发了一个非对称编码器-解码器架构,其中一个编码器只对可见的patches子集进行操作(没有掩码标记),以及一个轻量级解码器,可以从潜在表示和掩码标记重建原始图像。

我们发现屏蔽大部分输入图像,例如 75%,会产生重要且有意义的自监督任务。将这两种设计结合起来使我们能够高效地训练大型模型,将训练速度提高 3 倍或更多,并提高准确性。

论文在 ImageNet-1K (IN1K) 训练集上进行了自监督的预训练,然后进行了监督训练,以通过端到端的微调或线性探测来评估表示。他们使用 ViT-Large (ViT-L/16) 作为他们的模型并验证Top1准确性。

结果表明,MAE 学习了非常高容量的模型,这些模型也能很好地泛化。 使用普通的 ViT-Huge 模型,MAE 在 ImageNet-1K 上进行微调时达到了 87.8% 的准确率。

论文认为,扩展性好的简单算法是深度学习的核心。在NLP中,简单的自监督学习方法可以指数级别的增益模型。在计算机视觉中,尽管在自监督学习方面取得了进展,但实际的预训练模式仍主要受到监督。在ImageNet和迁移学习中观察到,自动编码器(autoencoder)提供了非常强的优势。视觉中的自监督学习现在可能正走上与NLP类似的轨道。

论文地址:arxiv/abs/2111.06377

本文来自 syncedreview,作者:Hecate He

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
2026澳门世界杯抽签揭晓,国乒双星喜获佳签,年轻选手却遭遇强敌挑战

2026澳门世界杯抽签揭晓,国乒双星喜获佳签,年轻选手却遭遇强敌挑战

烟浔渺渺
2026-03-25 07:33:40
赶走中企硬抢油田项目,出乱子后又来示好,中方回应:按规矩办事

赶走中企硬抢油田项目,出乱子后又来示好,中方回应:按规矩办事

凉湫瑾言
2026-03-24 19:13:33
秦岭乱扔垃圾后续:真实身份曝光,被处罚后道歉认怂单位也被牵连

秦岭乱扔垃圾后续:真实身份曝光,被处罚后道歉认怂单位也被牵连

青梅侃史啊
2026-03-25 07:23:33
国际油价大跌,现货黄金、白银拉升,特朗普称在对伊行动中已“取得胜利”

国际油价大跌,现货黄金、白银拉升,特朗普称在对伊行动中已“取得胜利”

每日经济新闻
2026-03-25 10:41:13
财神爷讲述:只有这5个生肖能驾驭貔貅,戴上后明年财运翻倍

财神爷讲述:只有这5个生肖能驾驭貔貅,戴上后明年财运翻倍

古怪奇谈录
2026-03-24 10:21:54
高三男孩喀纳斯湖失踪,母亲守岸7天后直言放弃,意外竟在此时发生

高三男孩喀纳斯湖失踪,母亲守岸7天后直言放弃,意外竟在此时发生

古怪奇谈录
2025-10-16 10:53:42
骑士三核87分制胜:米切尔42分连中关键球 哈登控局莫布利8中8

骑士三核87分制胜:米切尔42分连中关键球 哈登控局莫布利8中8

醉卧浮生
2026-03-25 10:42:39
张雪峰去世,给200名员工提前存了半年工资,给女儿留下过亿资产

张雪峰去世,给200名员工提前存了半年工资,给女儿留下过亿资产

阿凫爱吐槽
2026-03-25 10:27:59
出租车司机强行要求乘客下车,上海警方通报

出租车司机强行要求乘客下车,上海警方通报

界面新闻
2026-03-24 22:34:30
亲戚借车从不加油,这次他故意空着油箱给她,她老公却急了:我上次不是刚加了600块的油吗!

亲戚借车从不加油,这次他故意空着油箱给她,她老公却急了:我上次不是刚加了600块的油吗!

品读时刻
2026-03-25 09:04:33
70岁后才懂得:亲手带大的孙辈,不管孙子还是外孙,都有5个现实

70岁后才懂得:亲手带大的孙辈,不管孙子还是外孙,都有5个现实

艺鉴在线
2026-03-20 18:31:57
曝张雪峰猝逝,知情人曝其在跑步机上心梗,更多细节曝光!

曝张雪峰猝逝,知情人曝其在跑步机上心梗,更多细节曝光!

古希腊掌管松饼的神
2026-03-24 19:16:17
女生主动起来有多黏人?网友:这些女的太开放了

女生主动起来有多黏人?网友:这些女的太开放了

带你感受人间冷暖
2026-01-27 00:20:06
死磕上海!山西男篮翻盘秘籍:前三节咬住,第四节直接冲爆!

死磕上海!山西男篮翻盘秘籍:前三节咬住,第四节直接冲爆!

风风拒绝焦虑
2026-03-25 09:11:46
名记:保罗-乔治的25场禁赛执行完毕,他将于今日复出

名记:保罗-乔治的25场禁赛执行完毕,他将于今日复出

懂球帝
2026-03-25 00:43:40
韩国总理临时取消访华,发长文请中方谅解,不来中国实在是有苦衷

韩国总理临时取消访华,发长文请中方谅解,不来中国实在是有苦衷

知鉴明史
2026-03-25 09:03:48
泡沫破了!大批文旅项目开始批量倒闭

泡沫破了!大批文旅项目开始批量倒闭

新浪财经
2026-03-22 18:25:59
广西罗城警方发布一则无名尸体认领公告

广西罗城警方发布一则无名尸体认领公告

环球网资讯
2026-03-24 20:05:07
我的技术并不比世界第1差!我能打败任何人!郑钦文的话引发众怒

我的技术并不比世界第1差!我能打败任何人!郑钦文的话引发众怒

搏击江湖
2026-03-24 20:35:57
美智库曾说:若和中国高强度打7天,美国就会像法国一样光速投降

美智库曾说:若和中国高强度打7天,美国就会像法国一样光速投降

国际阿尝
2026-03-25 09:00:09
2026-03-25 11:11:00
deephub incentive-icons
deephub
CV NLP和数据挖掘知识
1958文章数 1461关注度
往期回顾 全部

科技要闻

红极一时却草草收场,Sora宣布正式关停

头条要闻

浙江海岛被指打响"取消中考第一枪" 有学生心态松懈

头条要闻

浙江海岛被指打响"取消中考第一枪" 有学生心态松懈

体育要闻

NBA最强左手射手,是个右撇子

娱乐要闻

张雪峰经抢救无效不幸去世 年仅41岁

财经要闻

张雪峰的多面人生:从寒门导师到教育商人

汽车要闻

智己LS8放大招 30万内8系旗舰+全线控底盘秀实力

态度原创

时尚
本地
房产
健康
数码

当年轻女性,闯入电竞圈

本地新闻

春日吃花第二站——陕西

房产要闻

北上广深二手房集体回暖!三月小阳春行情全面兑现

转头就晕的耳石症,能开车上班吗?

数码要闻

开源智能手表PineTime Pro即将上市=

无障碍浏览 进入关怀版