网易首页 > 网易号 > 正文 申请入驻

IJCAI 2023 | 知识外推综述:在知识图谱中如何泛化到新出现的未知实体或关系

0
分享至

本文主要总结了当前的知识外推方法,按照我们提出的分类法进行分类,描述了它们之间的相互关系,并介绍了该领域下一些常用的基准数据集,最后提出了在该领域下未来研究的潜在方向。

论文名称: Generalizing to Unseen Elements: A Survey on Knowledge Extrapolation for Knowledge Graphs 论文链接: https://arxiv.org/abs/2302.01859

一、引言

知识图谱(KG)已成为各种应用中重要的知识资源,同时知识图谱嵌入(KGE)方法近年来备受关注。然而,传统的KGE方法在模型测试中仍然面临着处理未知实体或关系(Unseen Entities or Relations)的挑战。最近的研究也在不同场景中对知识图谱中未知元素的泛化问题进行了研究。例如,一些研究着重于预测对于知识图谱之外(Out-Of-Knowledge-Base,OOKB)实体的缺失三元组,另一些归纳式关系(Inductive Relation Prediction)预测方法研究了如何泛化到包含未知实体的全新知识图谱。此外,对于在低资源环境中(如少样本和零样本情况下)泛化到未知关系的问题也得到了深入研究。

当前很多方法虽然都在讨论如何处理未知实体或者关系,但往往分散在不同的设定场景或者语境下。本综述将这些不同的方法进行抽象,使用一组通用的术语统一这些方法,并将它们统称为“知识外推”(Knowledge Extrapolation)。在本论文中,我们总结了当前的知识外推方法,按照我们提出的分类法进行分类,并描述了它们之间的相互关系。此外,我们介绍了该领域下一些常用的基准数据集。最后,我们提出了在该领域下未来研究的潜在方向。

二、知识外推的设定

知识外推方法旨在进行对未知元素(包括未知实体或关系)的链接预测。为了统一处理这些未知元素的现有研究,我们引入了一组通用术语。具体而言,在知识外推过程中,有两个用于测试的数据集:一个提供有关未知元素的支持信息(例如它们的结构或文本特征),另一个用于评估模型的链接预测能力,类似于原始测试集。我们将这两个数据集分别称为支持集 和查询集 ,测试集被构建为 。尽管不同的研究可能使用不同的术语,但它们在知识外推过程中都都会涉及这两个数据集。为了方便起见,我们统一称之为支持集和查询集。

在本研究中,我们将现有的处理未知元素的知识外推方法分为两类:实体外推(Entity Extrapolation)和关系(Relation Extrapolation)外推。如下图所示,我们使用术语“实体外推”来指代在测试集中出现训练时未见过的实体的情况,而使用“关系外推”来描述在测试集中存在训练时未见过的关系的情况。

三、知识外推方法的分类

如下图所示,我们根据这些方法的模型设计将它们进行分类。对于每一类方法,我们首先介绍其一般思想,然后深入探讨现有方法的具体细节。

四、实体外推

4.1 Entity Encoding-based Entity Extrapolation

传统的知识图谱嵌入方法通常学习了一个实体的嵌入表。然而,这一范式阻碍了模型对未知实体的外推。为了处理未知实体,一个直观的方法是学习如何编码实体,而不是学习固定的实体嵌入表。这些学到的编码器可以在实体的支持集上操作,为测试阶段新出现的实体生成合理的嵌入。我们将这一类方法称为基于实体编码的实体外推(Entity Encoding-based Entity Extrapolation)。

现有研究设计了各种编码模型 ,对应于支持集 中不同类型的信息。如果支持集是有关未知实体的三元组,那么 会从结构信息中编码这些实体。如果支持集包含关于未知实体的其他类型信息(例如文本描述),我们将这种情况称为从其他信息中编码未知实体。

这一类方法的典型模型有LAN、MorsE、StAR等。

4.2 Subgraph Predicting-based Entity Extrapolation

前述的基于实体编码的方法通常单独处理三元组中的头实体、关系和尾实体。然而,一些研究提供了另一种观点,它们将三元组中的头实体和尾实体一起处理,并编码它们之间的关系子图。这种观点假定了两个实体之间的子图语义可以用来预测它们的关系。编码两个实体的子图的能力可以外推到未知实体,因为子图结构与实体无关。

这一类方法的典型模型有GraIL、CoMPILE、TACT等。

4.3 Rule Learning-based Entity Extrapolation

还有一些研究探索了从知识图谱中学习规则从而完成知识外推,因为这些逻辑规则本质上不依赖于特定的实体,从而可以外推到未知实体。基于规则学习的方法可以分为两类。纯符号方法通过统计从现有知识中生成规则,并使用预定义的指标对其进行筛选,还有一类方法结合了神经网络和符号规则。

这一类方法的典型模型有AMIE、Neural LP、CBGNN等。

五、关系外推5.1 Entity Encoding-based Entity Extrapolation

与实体外推类似,传统的知识图谱嵌入方法在关系外推方面的不足之处在于它们不能为未知关系提供合理的嵌入表示。然而,由于未知关系的支持集中可以利用一些观察到的信息,将这些信息编码以嵌入表示关系是一个直观的解决方案。根据用于编码关系的信息类型,我们还将这些方法分类为从结构信息编码和从其他信息编码。

这一类方法的典型模型有MetaR、ZSGAN、OntoZSL等。

5.2 Entity Pair Matching-based Relation Extrapolation

另一种解决方案,不是直接对关系进行编码,而是对未知关系的头实体和尾实体对进行编码,然后将这些编码的实体对与查询集中的实体对进行匹配,以预测它们是否由相同的未知关系连接。

这一类方法的典型模型有GMatching、FSRL、FAAN。

六、未来展望

目前,大多数知识外推方法主要通过在测试集上进行链接预测来评估。尽管链接预测可以证明模型的有效性并有助于知识图谱的补全,但在各种下游应用中研究如何泛化到未知的知识图谱元素也具有重要价值。

同时现有的知识外推方法主要以自然语言作为未知元素的支持信息。然而,我们认为图像等多模态信息也可以用于泛化,因为它们可以被特定的预训练编码器所理解。此外,超关系型知识图谱也可以提供不同的模态信息。

现有知识外推研究主要集中在解决实体外推和关系外推,但在实际应用中,未知实体和关系可能同时出现。如何同时考虑未知关系和实体也是未来值得研究的方向之一。

在实际应用中,一些知识图谱包含了时间约束,需要在知识图谱外推中考虑时间信息。此外,现有的知识外推方法通常假定单次外推,但最近的一些研究考虑了多批次和终身学习设定下未知元素出现的情况。

七、总结

近年来,解决如何泛化到测试阶段知识图谱中未知元素的研究逐渐增多。本文对当前这些研究提供了相对全面的综述,并使用一组通用术语对它们进行总结。我们采用我们提出的系统分类法对现有方法进行分类,并列出了常用的基准测试以及采用这些基准测试的方法。我们希望这一探索可以为该领域提供清晰的描述,并促进未来的研究。如果对该综述的细节感兴趣,欢迎各位研究者阅读本综述的论文原文。

作者:陈名杨 来源:公众号【ZJUKG】

Illustration by IconScout Store Delesign Graphics

-The End-

扫码观看!

本周上新!

“AI技术流”原创投稿计划

TechBeat是由将门创投建立的AI学习社区(www.techbeat.net)。社区上线500+期talk视频,3000+篇技术干货文章,方向覆盖CV/NLP/ML/Robotis等;每月定期举办顶会及其他线上交流活动,不定期举办技术人线下聚会交流活动。我们正在努力成为AI人才喜爱的高质量、知识型交流平台,希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。

投稿内容

// 最新技术解读/系统性知识分享 //

// 前沿资讯解说/心得经历讲述 //

投稿须知

稿件需要为原创文章,并标明作者信息。

我们会选择部分在深度技术解析及科研心得方向,对用户启发更大的文章,做原创性内容奖励

投稿方式

发送邮件到

chenhongyuan@thejiangmen.com

或添加工作人员微信(chemn493)投稿,沟通投稿详情;还可以关注“将门创投”公众号,后台回复“投稿”二字,获得投稿说明。

关于我“门”

将门是一家以专注于数智核心科技领域新型创投机构,也是北京市标杆型孵化器。 公司致力于通过连接技术与商业,发掘和培育具有全球影响力的科技创新企业,推动企业创新发展与产业升级。

将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。

如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务,欢迎发送或者推荐项目给我“门”:

bp@thejiangmen.com

点击右上角,把文章分享到朋友圈

⤵一键送你进入TechBeat快乐星球

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
A股:股民准备好下车,主力已经明牌了,3月20日周五尾声将到?

A股:股民准备好下车,主力已经明牌了,3月20日周五尾声将到?

另子维爱读史
2026-03-19 19:01:06
伊朗警告:进攻与防御力度空前!若能源设施再遭袭将反击报复,直至将美国、以色列及其盟友的能源基础设施彻底摧毁为止

伊朗警告:进攻与防御力度空前!若能源设施再遭袭将反击报复,直至将美国、以色列及其盟友的能源基础设施彻底摧毁为止

每日经济新闻
2026-03-19 20:38:16
两性关系:中年女人喜欢的男人,多半不是别人,而是这三种熟人

两性关系:中年女人喜欢的男人,多半不是别人,而是这三种熟人

奇怪的鲨鱼们
2026-03-03 10:22:52
刚刚!突发利好,逆市暴涨!

刚刚!突发利好,逆市暴涨!

中国基金报
2026-03-19 14:29:14
贾国龙“消失”的这两个月在干什么?

贾国龙“消失”的这两个月在干什么?

界面新闻
2026-03-19 08:01:04
再打下去将灭国!俄罗斯换了战术猛攻乌克兰,第聂伯地堡真相大白

再打下去将灭国!俄罗斯换了战术猛攻乌克兰,第聂伯地堡真相大白

杰丝聊古今
2026-03-19 23:38:45
最新:乌克兰收复扎波罗热东北关键四地!俄军被迫败退

最新:乌克兰收复扎波罗热东北关键四地!俄军被迫败退

项鹏飞
2026-03-18 22:01:56
女人,就要 “挺胸自由”

女人,就要 “挺胸自由”

飛娱日记
2026-03-16 08:59:00
她是上海著名主持,也是新老娘舅"铁三角",被开除后现状令人唏嘘

她是上海著名主持,也是新老娘舅"铁三角",被开除后现状令人唏嘘

白面书誏
2026-03-19 17:33:07
辽宁为何换乌戈就流畅:不是人不行,是逻辑全换了

辽宁为何换乌戈就流畅:不是人不行,是逻辑全换了

谭颞爱搞笑
2026-03-18 23:08:52
普京等到了!俄罗斯对中国违约,7艘油轮转向印度,中方早有准备

普京等到了!俄罗斯对中国违约,7艘油轮转向印度,中方早有准备

蔡蔡说史
2026-03-20 02:32:35
开战前伊朗都退让到几乎投降了,美国为啥还要动手?

开战前伊朗都退让到几乎投降了,美国为啥还要动手?

音乐时光的娱乐
2026-03-20 02:53:12
等我们老了,最扎心的从不是病与死,而是这无声的“溃败”

等我们老了,最扎心的从不是病与死,而是这无声的“溃败”

青苹果sht
2026-03-18 05:35:16
输福建5分!揪出3个“废柴”,坑惨了首钢队

输福建5分!揪出3个“废柴”,坑惨了首钢队

体育哲人
2026-03-19 23:42:04
夫妻性生活:女人最讨厌的5种“床上行为”,男人千万别犯!

夫妻性生活:女人最讨厌的5种“床上行为”,男人千万别犯!

精彩分享快乐
2025-11-25 00:05:03
“龙抬头4不吃,一年不惹祸”,4不吃指啥?尊重传统,免得闹笑话

“龙抬头4不吃,一年不惹祸”,4不吃指啥?尊重传统,免得闹笑话

小茉莉美食记
2026-03-19 01:30:03
成都网友建议取消春秋假,回应来了

成都网友建议取消春秋假,回应来了

天府观察
2026-03-19 19:16:56
仅差1场!仅差50分!NBA大小王迎来神级里程碑,一生之敌英雄相惜

仅差1场!仅差50分!NBA大小王迎来神级里程碑,一生之敌英雄相惜

世界体育圈
2026-03-20 00:05:05
佩斯科夫:俄罗斯强烈谴责杀害伊朗主权国家领导层代表的行为

佩斯科夫:俄罗斯强烈谴责杀害伊朗主权国家领导层代表的行为

山河路口
2026-03-18 20:10:28
大陆通过新法,赖清德直接紧张了,台陆委会:“跨国镇压”

大陆通过新法,赖清德直接紧张了,台陆委会:“跨国镇压”

潋滟晴方DAY
2026-03-19 22:43:41
2026-03-20 04:51:00
将门创投 incentive-icons
将门创投
加速及投资技术驱动型初创企业
2316文章数 596关注度
往期回顾 全部

教育要闻

这节课的专注程度已经超过现实中的任何一堂课了

头条要闻

美军一架F-35战机疑似被伊朗火力击中后紧急降落

头条要闻

美军一架F-35战机疑似被伊朗火力击中后紧急降落

体育要闻

他们专卖“老头鞋”,却能签下19岁NBA未来门面?

娱乐要闻

胡歌初恋回应曝光书信 否认用爆料赚钱

财经要闻

伊朗战争会是"美国金融危机"导火索吗?

科技要闻

小米新一代SU7上市,售价21.99万

汽车要闻

不到10万还有激光雷达 零跑A10体验超预期

态度原创

旅游
游戏
本地
数码
公开课

旅游要闻

70万平方米文旅盛宴即将亮相,上海旅游产业博览会下周启幕

《GTA6》价格定调了!CEO暗示70到80美元

本地新闻

春色满城关不住|绍兴春日顶流,这片樱花海藏不住了

数码要闻

仅1.08kg!小米笔记本Pro 14首销7999元起:搭载酷睿Ultra X7 358H

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版