网易首页 > 网易号 > 正文 申请入驻

基于观测数据的因果发现及因果性学习

0
分享至

导语

因果发现及因果性学习,可以帮助从观察数据中发现变量之间的因果关系。在集智俱乐部因果科学读书会中,教授从因果图构建的模型与假设出发,对基于约束的方法、基于因果函数模型的方法和混合型方法这三大类因果关系发现方法进行介绍,并探讨因果性学习在人工智能领域的应用。

随着“因果革命”在人工智能与大数据领域徐徐展开,作为连接因果科学与深度学习桥梁的因果表征学习,成为备受关注的前沿方向。以往的深度表征学习在数据降维中保留信息并过滤噪音,新兴的因果科学则形成了因果推理与发现的一系列方法。随着二者结合,因果表征学习有望催生更强大的新一代AI。新一季的已经启动,欢迎从事相关研究的各界朋友参与,详情见文末。

研究领域:因果科学,因果发现,因果学习

蔡瑞初| 讲者

钱坤|整理

邓一雪|编辑

因果关系一直是人类认识世界的基本方式和现代科学的基石,可以帮助我们理解很多复杂的现实场景。与相关关系对比,因果关系严格区分了“原因”变量和“结果”变量,在揭示事物发生机制、指导干预行为等方面有相关关系不能替代的重要作用。

1. 如何发现因果结构

认识事物间的因果关系,最直接的方法是做随机实验,但在现实生活中,随机实验有时不具备可操作性,我们越来越希望能够从观测数据中得到因果关系,这其中最基本的核心点是需要找到有助于我们发现因果关系的额外信息,建立起因果结构和观测的统计数据之间的桥梁,下面介绍三种常用的方法:

1)基于约束的方法:主要是PC (Peter-Clark) 算法和IC (Inductive Causality) 算法,核心原理是基于独立性和条件独立性判断变量之间的独立性,获得因果图,并利用V-结构和定向规则对变量间的无向边进行定向。这种方法的缺点是无法区分马尔可夫等价类结构。

图1:基于约束的因果关系发现方法

2)基于因果函数模型的方法:主要是加性噪声模型 (ANM) 和后非线性模型 (PNL) ,核心原理是假设结果Y和原因X具有函数关系,如果X对Y做正向回归,噪声项与X独立,Y对X做反向回归,噪声项与Y不独立,则推断X是Y的原因。

图2:基于因果函数模型的因果关系发现方法

对于离散的类别型数据,由于无法直接定义加法操作和回归函数操作,为了发现不对称性,可以通过在 “X -> Y’ -> Y”前后两个过程中建立似然度函数来保证模型的可识别性,找到X和Y之间的因果关系。

3)混合型方法: 由于基于约束的方法,无法识别马尔可夫等价类的问题,而基于因果函数模型的方法,只能判断一个变量对结果变量的影响,无法解决实际生活中多变量的问题,两类方法在现实中均存在一定的不适用性。 为了解决这一问题,引入混合型方法,核心原理是将似然度框架嵌入因果函数模型,发现数据间的因果结构。

图3:混合型因果关系发现方法

2. 隐变量场景下,如何发现因果结构

现实场景中,经常有许多存在隐变量的情况,如果数据是线性非高斯的,可将独立噪声条件(IN)扩展到广义独立噪声条件(GIN),通过找到隐变量的代理变量做回归,恢复数据的因果结构。具体步骤:

1)找到共享同样的隐变量父节点的观察变量cluster;

2)根据隐变量与观察变量cluster的关系,找到不用隐变量之间的关系。

图4:隐变量场景下因果关系发现方法

但这种方法的局限性在于其认为观测变量之间没有边,无法推断变量之间完整的因果关系,在此基础上可以利用面向不完全观察数据的因果结构学习算法(FRITL算法)做进一步的优化,具体步骤:

1)基于独立性条件利用FCI方法构建祖先图(PAG);

2)利用独立噪声条件(IN)推断每个祖先图(PAG)局部的因果方向;

3)局部的因果方向无法判别时,引入隐变量,利用三分体约束,检测并合并同一个隐变量,估计未确定的局部因果结构。

图5:隐变量场景下利用FRITL算法的因果关系发现方法

3. 因果性学习在人工智能中的应用

正如图灵奖得奖者Pearl Judea提出的 “因果关系之梯” 中特别指出,我们当前的机器学习只处于第一层,只是“弱人工智能”,要实现“强人工智能”还需要干预和反事实推理。因果推断对于克服现有人工智能在抽象、推理、可解释性等方面的不足具有重要意义,比如

(1)在领域迁移中,可以基于因果机制抽象出语义信息实现领域自适应 (domain adaptation) ,解决方案是利用变分自编码器 (VAE) 框架,在隐空间 (latent space) 中,从x学到label y和domain的隐变量,再基于监督信号,将label相关的信息和domain相关的信息解耦,把语义的label信息单独抽离出来进行判别,这种方法在剪切图、艺术图、产品图上都取得了较好的实验效果。

图6:领域迁移中的解耦方法

图7:领域迁移中的解耦步骤

(2)在推荐系统中,我们可以利用因果图解决自选择偏差的问题。假设历史数据是多种营销策略的混合体 (sij) ,且我们可以通过社交网络 (Gi) 来推断ui的信息,通过建立因果图,可以看到sij节点附近形成两个v结构,通过eij、vj、ui等变量信息我们就可以推断sij的信息,从而帮助我们推断历史上采取了哪些不同的营销策略,进而辅助提升推荐的效果。

图8:推荐系统解决自选择偏差的方法

4. 总结

因果推断框架的一个最基本的思想是:因果推断是关于世界的一个更加稳定的抽象模型。因果发现方法基于高阶信息推断因果结构,因果性学习从复杂信息中抽取因果结构,这两种方法也都是借鉴了这个思想。但由于受限于很多假设和理论基础,很多问题仍在研究过程中,有待大家进一步探索和解决。

在因果推断中,因果发现和因果性学习往往是互相促进的,因果发现会用很多VAE的工具,因果性学习也会利用因果图的先验信息,在探索过程中可以将两方面结合起来打通思考。

图9:因果推断框架总结

参考文献:

[1] Cai R, Qiao J, Zhang K, et al. Causal discovery from discrete data using hidden compact representation.NeurIPS, 2018

[2] Cai R, Qiao J, Zhang Z, et al. Self: structural equational likelihood framework for causal discovery[C]// AAAI 2018, 32(1)

[3] Silva et al. (2006). Learning the structure of linear latent variable models, JMLR, 2006

[4] Xie, Cai, Huang, Glymour, Hao, Zhang, "Generalized Independent Noise Condition for Estimating Linear Non-Gaussian Latent Variable Causal Graphs," NeurIPS 2020

[5] Chen W, Zhang K, Cai R, et al. FRITL: A Hybrid Method for Causal Discovery in the Presence of Latent Confounders[J]. Submitted to JMLR, arXiv preprint arXiv:2103.14238, 2021

[6] Cai R, Li Z, Wei P, et al. Learning disentangled semantic representation for domain adaptation[C]//IJCAI:, 2019, 2019: 2060.

[7] Cai R, Li Z, et al. Social Recommendation under Discrete Unobserved Exposure Strategies[C]// coming. With wecha

讲者介绍

蔡瑞初,广东工业大学教授、博士生导师、省杰出青年基金获得者、DMIR实验室主任、广东省移动互联网电子商务大数据工程技术研究中心副主任。蔡教授专注于因果推断与因果性学习、深度学习等领域的理论与应用研究。已发表论文50余篇,包括ICML、NeurIPS、AAAI、IJCAI、SIGMOD、VLDB、SDM等领域重要会议和TNNLS、TKDE、NN、PR等国际著名期刊。上述成果在华为、网易、腾讯等企业应用实施,取得了良好的经济和社会价值。

蔡教授专注于因果推断与因果性学习、深度学习等领域的理论与应用研究。在上述领域先后主持国家自然科学基金、省杰出青年基金、省特支计划科技创新青年拔尖人才、珠江科技新星、市协同创新重大专项等项目。已发表论文50余篇,包括ICML、NeurIPS、AAAI、IJCAI、SIGMOD 、VLDB、SDM等领域重要会议和TNNLS、TKDE、NN、PR等国际著名期刊。上述成果在华为、网易、腾讯、唯品会、南方电网、南方通信建设等企业应用实施,取得了良好的经济和社会价值。先后获得省科学技术二等奖(第四完成人)、省科学技术一等奖(第三完成人)、国家发明专利奖优秀奖(第三完成人)。

因果表征学习读书会启动

随着“因果革命”在人工智能与大数据领域徐徐展开,作为连接因果科学与深度学习桥梁的因果表征学习,成为备受关注的前沿方向。以往的深度表征学习在数据降维中保留信息并过滤噪音,新兴的因果科学则形成了因果推理与发现的一系列方法。随着二者结合,因果表征学习有望催生更强大的新一代AI。

集智俱乐部组织以“因果表征学习”为主题、为期十周的读书会,聚焦因果科学相关问题,共学共研相关文献。欢迎从事因果科学、人工智能与复杂系统等相关研究领域,或对因果表征学习的理论与应用感兴趣的各界朋友报名参与。集智俱乐部已经组织三季“因果科学”读书会,形成了超过千人的因果科学社区,是其第四季,现在加入读书会即可参与因果社区各类线上线下交流合作。

详情请见:




特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
对苏州警方公示胡友平“见义勇为模范”的七大强烈抗议!

对苏州警方公示胡友平“见义勇为模范”的七大强烈抗议!

兵叔评说
2024-06-28 13:19:30
B站网红奈妮直播大瓜,直播“喷泉”遭封,录屏视频曝光

B站网红奈妮直播大瓜,直播“喷泉”遭封,录屏视频曝光

新动察plus
2024-06-27 11:36:50
王艳儿子靠篮球特长进北大,有钱有人脉有资源的家长们,知道该干嘛了吧

王艳儿子靠篮球特长进北大,有钱有人脉有资源的家长们,知道该干嘛了吧

老郭在学习
2024-06-28 11:01:18
黄一鸣莎疯了,跟王思聪要钱头像改成钱,网友:思聪碰到硬茬子了

黄一鸣莎疯了,跟王思聪要钱头像改成钱,网友:思聪碰到硬茬子了

柠檬有娱乐
2024-06-28 14:50:51
刚刚,南海传出爆炸消息!美军果然出手了,解放军被彻底激怒

刚刚,南海传出爆炸消息!美军果然出手了,解放军被彻底激怒

青年的背包
2024-06-28 14:09:44
81岁拜登在“灾难性辩论”后,被妻子吉尔领下台,民主党或会换人

81岁拜登在“灾难性辩论”后,被妻子吉尔领下台,民主党或会换人

译言
2024-06-28 14:56:03
900万人一夜之间消失,没有任何记载,DNA找到了踪迹,他们去哪了

900万人一夜之间消失,没有任何记载,DNA找到了踪迹,他们去哪了

飞云如水
2024-06-27 22:15:02
韦东奕堂姐请吃饭,韦神仍带三个馒头引热议,对象问题首次被公开

韦东奕堂姐请吃饭,韦神仍带三个馒头引热议,对象问题首次被公开

育学笔谈
2024-06-28 11:52:16
黄一鸣曝光王思聪聊天内容:要奶粉钱被拒绝,爷爷奶奶不知有孙女

黄一鸣曝光王思聪聊天内容:要奶粉钱被拒绝,爷爷奶奶不知有孙女

素素娱乐
2024-06-28 09:48:32
黄一鸣公开晒出了和王思聪的聊天记录,内容可是让人大跌眼镜啊!

黄一鸣公开晒出了和王思聪的聊天记录,内容可是让人大跌眼镜啊!

一神娱乐
2024-06-28 10:02:49
被打马赛克的杨颖很狼狈,8000万一部戏的风光,估计是很难回去了

被打马赛克的杨颖很狼狈,8000万一部戏的风光,估计是很难回去了

七阿姨爱八卦
2024-06-27 21:58:06
7月8日:美国发出威胁警告,若李尚福再不接电话,将采取行动!

7月8日:美国发出威胁警告,若李尚福再不接电话,将采取行动!

史家评ing
2023-07-08 15:53:00
这次,长沙四胞胎父亲在劫难逃,身份被曝,道歉理由无法自圆其说

这次,长沙四胞胎父亲在劫难逃,身份被曝,道歉理由无法自圆其说

辣条小剧场
2024-06-28 01:39:46
宿迁市宿豫区科技局原局长、四级调研员赵彦被查

宿迁市宿豫区科技局原局长、四级调研员赵彦被查

鲁中晨报
2024-06-28 11:19:05
官方证实苏州救日本母子市民已去世,日媒找到现场目击者:要不是她,五六十个小孩恐要遭殃

官方证实苏州救日本母子市民已去世,日媒找到现场目击者:要不是她,五六十个小孩恐要遭殃

可达鸭面面观
2024-06-28 08:34:19
姜萍事件有反转?姜萍决赛后,用一句话霸气回应外界质疑!

姜萍事件有反转?姜萍决赛后,用一句话霸气回应外界质疑!

阿裤聊历史
2024-06-28 09:42:45
救日本母子的女子已离世!被救者发声还原真相,网友呼吁惠及家属

救日本母子的女子已离世!被救者发声还原真相,网友呼吁惠及家属

飘飘视角
2024-06-28 11:39:59
首场美国总统候选人辩论花絮速览:有气无力VS大放厥词

首场美国总统候选人辩论花絮速览:有气无力VS大放厥词

财联社
2024-06-28 11:54:25
外交部:对胡友平女士不幸离世表示哀悼

外交部:对胡友平女士不幸离世表示哀悼

新京报
2024-06-28 16:04:08
可能不只姜萍,在阿里数学竞赛预赛里,北大清华中科院都是作弊大户

可能不只姜萍,在阿里数学竞赛预赛里,北大清华中科院都是作弊大户

互联网大聪明
2024-06-28 10:24:19
2024-06-28 17:44:50
集智俱乐部
集智俱乐部
科普人工智能相关知识技能
4578文章数 4589关注度
往期回顾 全部

科技要闻

售价近三万,苹果Vision Pro中国首销

头条要闻

培植个人势力、大搞新型腐败 "新疆虎"李鹏新被逮捕

头条要闻

培植个人势力、大搞新型腐败 "新疆虎"李鹏新被逮捕

体育要闻

哪有什么死亡之组?踢就完了!

娱乐要闻

黄一鸣曝光王思聪聊天内容

财经要闻

A股上半年人均亏损1.2万 中证2000跌23%

汽车要闻

你没看错!广汽丰田今天秀了一把智电技术

态度原创

教育
家居
本地
时尚
公开课

教育要闻

数字世界,科创未来 | 山东省科创教育课程与活动设计培训活动在潍坊举办

家居要闻

美式风格 呈现田园风格

本地新闻

冷知识:东北雪糕才是最早的网红雪糕

50岁女人最“体面”的穿搭,靠的就是这3个套路,谁穿都优雅

公开课

连中三元是哪三元?

无障碍浏览 进入关怀版