网易首页 > 网易号 > 正文 申请入驻

系统调研160篇文献,领域泛化首篇综述问世,已被IJCAI 2021接收

0
分享至

机器之心专栏

作者:王晋东



在这篇文章中,中国科学院大学计算机应用技术博士、微软亚洲研究院研究员王晋东介绍了 DG(领域泛化)领域的第一篇综述论文。

领域泛化 (Domain Generalization, DG) 是近几年非常热门的一个研究方向。它研究的问题是从若干个具有不同数据分布的数据集(领域)中学习一个泛化能力强的模型,以便在未知(Unseen) 的测试集上取得较好的效果。


本文介绍 DG 领域的第一篇综述文章《Generalizing to Unseen Domains: A Survey on Domain Generalization》。该论文一共调研了 160 篇文献,其中直接与领域泛化相关的有 90 篇。文章从问题定义、理论分析、方法总结、数据集和应用介绍、未来研究方向等几大方面对领域泛化问题进行了详细的概括和总结。

该论文的精简版已被国际人工智能顶会IJCAI-21录用。

请点击输入图片描述(最多18字)

  • 文章链接:https://arxiv.org/abs/2103.03097
  • PDF:https://arxiv.org/pdf/2103.03097
  • 作者单位:微软亚洲研究院、中央财经大学

问题定义

领域泛化问题与领域自适应 (Domain Adaptation,DA) 最大的不同:DA 在训练中,源域和目标域数据均能访问(无监督 DA 中则只有无标记的目标域数据);而在 DG 问题中,我们只能访问若干个用于训练的源域数据,测试数据是不能访问的。毫无疑问,DG 是比 DA 更具有挑战性和实用性的场景:毕竟我们都喜欢「一次训练、到处应用」的足够泛化的机器学习模型。

例如,在下图中,DA 问题假定训练集和测试集都可以在训练过程中被访问,而 DG 问题中则只有训练集。

请点击输入图片描述(最多18字)

DG 问题的示意图如下所示,其形式化定义如下:

请点击输入图片描述(最多18字)

请点击输入图片描述(最多18字)

DG 不仅与 DA 问题有相似之处,其与多任务学习、迁移学习、元学习、终身学习等,都有一些类似和差异之处。我们在下表中对它们的差异进行了总结。

请点击输入图片描述(最多18字)

理论

我们从 Domain adaptation 理论出发,分析影响不同领域学习结果的因素,如

图片模糊,建议替换或删除×

请点击输入图片描述(最多18字)

-divergence、

图片模糊,建议替换或删除×

请点击输入图片描述(最多18字)

-divergence 等,继而过渡到领域 Domain generalization 问题中,分析影响模型泛化到新领域的因素。

从理论上总结了领域泛化问题的重要结果,为今后进行相关研究指明了理论方向。

详细结果请参考原文第 3 部分。

方法

领域泛化方法是我们的核心。我们将已有的领域泛化方法按照数据操作、表征学习、学习策略分为三大方面,如下图所示。

请点击输入图片描述(最多18字)

其中:

  1. 数据操作,指的是通过对数据的增强和变化使训练数据得到增强。这一类包括数据增强和数据生成两大部分。
  2. 表征学习,指的是学习领域不变特征 (Domain-invariant representation learning) 以使得模型对不同领域都能进行很好地适配。领域不变特征学习方面主要包括四大部分:核方法、显式特征对齐、领域对抗训练、以及不变风险最小化(Invariant Risk Minimiation, IRM)。特征解耦与领域不变特征学习的目标一致、但学习方法不一致,我们将其单独作为一大类进行介绍。
  3. 学习策略,指的是将机器学习中成熟的学习模式引入多领域训练中使得模型泛化性更强。这一部分主要包括基于集成学习和元学习的方法。同时,我们还会介绍其他方法,例如自监督方法在领域泛化中的应用。

在文章中,我们对每大类方法都进行了详细地介绍与总结。

应用与数据集

领域泛化问题在众多领域都得到了广泛应用。大多数已有工作偏重于设计更好的 DG 方法,因此,其往往都在图像分类数据上进行评估。除此之外,DG 方法还被应用于行人再识别(Re-ID)、语义分割、街景识别、视频理解等计算机视觉的主流任务中。

特别地,DG 方法被广泛应用于健康医疗领域,例如帕金森病识别、组织分割、X 光胸片识别、以及震颤检测等。

在自然语言处理领域,DG 被用于情感分析、语义分割、网页分类等应用。

DG 也在强化学习、自动控制、故障检测、语音检测、物理学、脑机接口等领域中得到了广泛应用。

下图展示了领域泛化问题中流行的标准数据集。

请点击输入图片描述(最多18字)

未来挑战

我们对 DG 进行以下展望:

  • 连续领域泛化:一个系统应具有连续进行泛化和适配的能力,目前只是离线状态的一次应用。
  • 新类别的领域泛化:目前我们假定所有的领域具有相同的类别,未来需要扩展到不同类别中、乃至新类别中。
  • 可解释的领域泛化:尽管基于解耦的方法在可解释性上取得了进步,但是,其他大类的方法的可解释性仍然不强。未来需要对它们的可解释性进行进一步研究。
  • 大规模预训练与领域泛化:众所周知,大规模预训练(如 BERT)已成为主流,那么在不同问题的在规模预训练中,我们如何利用 DG 方法来进一步提高这些预训练模型的泛化能力?
  • 领域泛化的评价:尽管有工作在经验上说明已有的领域泛化方法的效果并没有大大领先于经验风险最小化,但其只是基于最简单的分类任务。我们认为 DG 需要在特定的评测,例如行人再识别中才能最大限度地发挥其作用。未来,我们需要找到更适合 DG 问题的应用场景。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
大奖来了!王楠奖励王楚钦、孙颖莎6公斤黄金,上届曾送出9套豪宅

大奖来了!王楠奖励王楚钦、孙颖莎6公斤黄金,上届曾送出9套豪宅

社会故事回忆录
2024-08-01 08:47:27
便秘是肺,鼻塞是肺,易醒也是肺,教你一味中成药,通肺补肺!

便秘是肺,鼻塞是肺,易醒也是肺,教你一味中成药,通肺补肺!

今日养生之道
2024-09-06 21:12:28
“摩羯”过境后的文昌椰农:“只要能生根,就能活”丨封面深镜

“摩羯”过境后的文昌椰农:“只要能生根,就能活”丨封面深镜

封面新闻
2024-09-07 19:26:33
美网女单决赛-萨巴伦卡2-0战胜佩古拉,夺生涯第三座大满贯冠军

美网女单决赛-萨巴伦卡2-0战胜佩古拉,夺生涯第三座大满贯冠军

直播吧
2024-09-08 06:27:40
《Concord》美工自述:角色失败是因委员会干预

《Concord》美工自述:角色失败是因委员会干预

3DMGAME官方号
2024-09-07 21:18:21
儿子结婚,我邀请12位战友,却没一人送礼金,得知真相后我落泪

儿子结婚,我邀请12位战友,却没一人送礼金,得知真相后我落泪

二十一号故事铺
2024-09-04 13:45:02
田亮怒斥妻子出轨,细节不堪入目:你不要脸的样子,真恶心!

田亮怒斥妻子出轨,细节不堪入目:你不要脸的样子,真恶心!

二胡的岁月如歌
2024-08-26 18:45:29
“非洲土皇帝”王垚:生活奢靡美女成群,其中竟然还有世界小姐

“非洲土皇帝”王垚:生活奢靡美女成群,其中竟然还有世界小姐

山茶谈
2024-09-05 15:50:23
泽连斯基:遗憾不能打击克林姆林宫,英国不再做援乌领头羊

泽连斯基:遗憾不能打击克林姆林宫,英国不再做援乌领头羊

文雅笔墨
2024-09-07 19:57:24
不是lamer用不起,而是ta更有性价比

不是lamer用不起,而是ta更有性价比

言安堂
2024-09-06 07:34:48
破百万了!华为颠覆性“大作”,爆火!

破百万了!华为颠覆性“大作”,爆火!

数据宝
2024-09-08 07:47:26
危险时刻!美国踩刹车了!

危险时刻!美国踩刹车了!

大嘴说天下
2024-09-07 22:31:42
女子替朋友熬药中毒身亡,对方被判赔23万元 律师释法:雇主“提醒义务”的边界在哪?

女子替朋友熬药中毒身亡,对方被判赔23万元 律师释法:雇主“提醒义务”的边界在哪?

红星新闻
2024-09-07 16:03:42
笑不活了,姜妍恋情曝光上热搜,我却笑死在吉吉国王刘冠麟评论区

笑不活了,姜妍恋情曝光上热搜,我却笑死在吉吉国王刘冠麟评论区

校长侃财
2024-09-07 15:00:21
魔兽怀旧服大瓜:为让菜鸡兄弟过H本,团长陪女高玩睡10个月

魔兽怀旧服大瓜:为让菜鸡兄弟过H本,团长陪女高玩睡10个月

17173游戏网
2024-09-05 17:29:02
不要再歌功颂德了 现在不是旧社会 民智开化 好与不好 百姓心中很清楚

不要再歌功颂德了 现在不是旧社会 民智开化 好与不好 百姓心中很清楚

苗苗情感说
2024-08-20 20:58:45
点评历史:不要崇拜任何一位封建帝王!

点评历史:不要崇拜任何一位封建帝王!

黄河新流域
2024-08-31 06:10:12
菲律宾被打得落花流水,华裔学者咆哮质问:我们的海军去哪里了?

菲律宾被打得落花流水,华裔学者咆哮质问:我们的海军去哪里了?

日风的故事屋
2024-09-06 20:53:11
牛逼坏了!当红女星戚薇成北大研究生,网友讽刺:给钱就能上的吗

牛逼坏了!当红女星戚薇成北大研究生,网友讽刺:给钱就能上的吗

小耀爱生活
2024-09-06 02:33:49
基恩谈C罗生涯900球:他在那些射门威胁区域仍是世界最佳得分手

基恩谈C罗生涯900球:他在那些射门威胁区域仍是世界最佳得分手

直播吧
2024-09-08 05:12:09
2024-09-08 08:06:44
机器之心Pro
机器之心Pro
专业的人工智能媒体
9430文章数 142003关注度
往期回顾 全部

科技要闻

苹果发布会终极前瞻 会见到哪些更新?

头条要闻

村委会被指伪造合同流转村民土地 村支书:合同未执行

头条要闻

村委会被指伪造合同流转村民土地 村支书:合同未执行

体育要闻

24岁的锡安,正在和世界和解

娱乐要闻

37岁刘诗诗被吐槽脸越来越僵

财经要闻

针对光刻机等设备 荷兰还是下手了

汽车要闻

轴距2900mm smart精灵#5将于9月20日预售

态度原创

手机
艺术
家居
时尚
军事航空

手机要闻

别急着换机,5款Pro版新机已在路上,强大配置三五年不过时

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

家居要闻

苏式园林 高级原木质感

女人五十岁别穿廉价的衣服,这样打扮才有气质,不得不佩服

军事要闻

柬埔寨国防部:中国将向柬埔寨提供两艘056型护卫舰

无障碍浏览 进入关怀版