网易首页 > 网易号 > 正文 申请入驻

因果发现工具箱

0
分享至

导语

Causal Discovery Toolbox (cdt)是一个应用于图模型和Pyhton >=3.5 版本中的因果推断工具箱。包含了图结构恢复和相关依赖。该工具箱基于以下模块和语言构建:Numpy、Sciki-learn、Pytorch、R。

该工具箱包含了很多基于观测数据进行图结构恢复的算法(诸如 bnlearn、pcalg 算法)。

Leo| 编译

邓一雪| 编辑

文档题目: Causal Discovery Toolbox Documentation ‒ Causal Discovery Toolbox 0.5.23 documentation 文档链接:: https://fentechsolutions.github.io/CausalDiscoveryToolbox/html/index.html

Docker 镜像

该工具箱提供了Docker镜像,镜像中包含了所有依赖和启动项。

安装

需要版本号不低于 3.5 的Pyhton,以及 requirements.txt 中所列举出的模块。如果需要使用额外的功能则需要安装更多的模块。在安装指南中可以看到最小安装和完全安装的方式。

注意:对于非专业用户而言,(mini/ana) conda 框架有助于管理相关依赖。请查阅官网 http://pytorch.org 获取相关的配置信息。

安装 PyTorch

由于cdt(CausalDiscoveryToolbox)模块模块中的关键算法使用了 PyTorch 模块,所以需要安装PyTorch。

通过 PyPi 安装 CausalDiscoveryToolbox

可通过PyPi安装相关模块:

pip install cdt

也可以通过源代码安装

$ git clone https://github.com/FenTechSolutions/CausalDiscoveryToolbox.git # Download the package

$ cd CausalDiscoveryToolbox

$ pip install -r requirements.txt # Install the requirements

$ python setup.py install develop --user

安装完成后就可以导入运行模块。CausalDiscoveryToolbox 中的大多数算法应该都可以使用,不可用的算法会看到警告。

可通过一下方式导入模块:

import cdt

文档中包含了该模块的额外信息:

https://github.com/FenTechSolutions/CausalDiscoveryToolbox/blob/master/documentation.md

R语言与R语言库

如果要在使用 cdt 模块中,使用诸如 nlearn、kpcalg、pcalg 等由 R 语言编写的的算法,就需要安装 R 语言。

travis.yml 文件的预安装部分可以查看基于 Debian 的R语言安装依赖。r-requirements 文件则包含了 cdt 模块所需要的 R 语言包。

文件总览

模块包结构

下图展现了相关的模块与算法包结构

硬件与算法设置

该工具箱有一个SETTING类可用于对硬件进行设置。这些设置是唯一的。默认参数定义于cdt/utils/Settings

可以通过一下代码访问并修改配置

import cdt

cdt.SETTINGS

此外在启动时,可以使用 cdt.utils.Settings.autoset_settings 方法来自动配置硬件参数(例如,GPU,CPU数量,可选软件包的数量)

图类

相关模块用到了两个基于 networkx 的类,分别是:DiGraph 和 Graph。

参考

[1] Wang, S., Nan, B., Rosset, S., & Zhu, J. (2011). Random lasso. The annals of applied statistics, 5(1), 468.

[2] Friedman, J., Hastie, T., & Tibshirani, R. (2008). Sparse inverse covariance estimation with the graphical lasso. Biostatistics, 9(3), 432-441.

[3] Yamada, M., Jitkrittum, W., Sigal, L., Xing, E. P., & Sugiyama, M. (2014). High-dimensional feature selection by feature-wise kernelized lasso. Neural computation, 26(1), 185-207.

[4] Feizi, S., Marbach, D., Médard, M., & Kellis, M. (2013). Network deconvolution as a general method to distinguish direct dependencies in networks. Nature biotechnology, 31(8), 726-733.

[5] Guyon, I., Weston, J., Barnhill, S., & Vapnik, V. (2002). Gene selection for cancer classification using support vector machines. Machine learning, 46(1), 389-422.

[6] Vapnik, V., Golowich, S. E., & Smola, A. J. (1997). Support vector method for function approximation, regression estimation and signal processing. In Advances in neural information processing systems (pp. 281-287).

[7] Kira, K., & Rendell, L. A. (1992, July). The feature selection problem: Traditional methods and a new algorithm. In Aaai (Vol. 2, pp. 129-134).

[8] MacKay, D. J. (1992). Bayesian interpolation. Neural Computation, 4, 415–447.

[9] Neal, R. M. (1996). Bayesian learning for neural networks. No. 118 in Lecture Notes in Statistics. New York: Springer.

[10] Gretton, A., Bousquet, O., Smola, A., & Scholkopf, B. (2005, October). Measuring statistical dependence with Hilbert-Schmidt norms. In ALT (Vol. 16, pp. 63-78).

[11] Vinh, N. X., Epps, J., & Bailey, J. (2010). Information theoretic measures for clusterings comparison: Variants, properties, normalization and correction for chance. Journal of Machine Learning Research, 11(Oct), 2837-2854.

[12] Goudet, O., Kalainathan, D., Caillou, P., Lopez-Paz, D., Guyon, I., Sebag, M., ... & Tubaro, P. (2017). Learning functional causal models with generative neural networks. arXiv preprint arXiv:1709.05321.

[13] Spirtes, P., Glymour, C., Scheines, R. (2000). Causation, Prediction, and Search. MIT press.

[14] Hoyer, P. O., Janzing, D., Mooij, J. M., Peters, J., & Schölkopf, B. (2009). Nonlinear causal discovery with additive noise models. In Advances in neural information processing systems (pp. 689-696).

[15] Janzing, D., Mooij, J., Zhang, K., Lemeire, J., Zscheischler, J., Daniušis, P., ... & Schölkopf, B. (2012). Information-geometric approach to inferring causal directions. Artificial Intelligence, 182, 1-31.

[16] Lopez-Paz, D., Muandet, K., Schölkopf, B., & Tolstikhin, I. (2015, June). Towards a learning theory of cause-effect inference. In International Conference on Machine Learning (pp. 1452-1461).

[17] Lopez-Paz, D., Nishihara, R., Chintala, S., Schölkopf, B., & Bottou, L. (2017, July). Discovering causal signals in images. In Proceedings of CVPR.

[18] Stegle, O., Janzing, D., Zhang, K., Mooij, J. M., & Schölkopf, B. (2010). Probabilistic latent variable models for distinguishing between cause and effect. In Advances in Neural Information Processing Systems (pp. 1687-1695).

[19] Zhang, K., & Hyvärinen, A. (2009, June). On the identifiability of the post-nonlinear causal model. In Proceedings of the twenty-fifth conference on uncertainty in artificial intelligence (pp. 647-655). AUAI Press.

[20] Fonollosa, J. A. (2016). Conditional distribution variability measures for causality detection. arXiv preprint arXiv:1601.06680.

[21] Gretton, A., Borgwardt, K. M., Rasch, M. J., Schölkopf, B., & Smola, A. (2012). A kernel two-sample test. Journal of Machine Learning Research, 13(Mar), 723-773.

[22] Li, Y., Swersky, K., & Zemel, R. (2015). Generative moment matching networks. In Proceedings of the 32nd International Conference on Machine Learning (ICML-15) (pp. 1718-1727).

[23] Margaritis D (2003). Learning Bayesian Network Model Structure from Data . Ph.D. thesis, School of Computer Science, Carnegie-Mellon University, Pittsburgh, PA. Available as Technical Report CMU-CS-03-153

[24] Tsamardinos I, Aliferis CF, Statnikov A (2003). “Algorithms for Large Scale Markov Blanket Discovery”. In “Proceedings of the Sixteenth International Florida Artificial Intelligence Research Society Conference”, pp. 376-381. AAAI Press.

[25] Tsamardinos I, Aliferis CF, Statnikov A (2003). “Time and Sample Efficient Discovery of Markov Blankets and Direct Causal Relations”. In “KDD ’03: Proceedings of the Ninth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining”, pp. 673-678. ACM. Tsamardinos I, Brown LE, Aliferis CF (2006). “The Max-Min Hill-Climbing Bayesian Network Structure Learning Algorithm”. Machine Learning,65(1), 31-78.

[26] Kalainathan, Diviyan & Goudet, Olivier & Guyon, Isabelle & Lopez-Paz, David & Sebag, Michèle. (2018). SAM: Structural Agnostic Model, Causal Discovery and Penalized Adversarial Learning.

[27] Aragam, B., & Zhou, Q. (2015). Concave penalized estimation of sparse Gaussian Bayesian networks. Journal of Machine Learning Research, 16, 2273-2328.

[28] Bloebaum, P., Janzing, D., Washio, T., Shimizu, S., & Schoelkopf, B. (2018, March). Cause-Effect Inference by Comparing Regression Errors. In International Conference on Artificial Intelligence and Statistics (pp. 900-909).

[29] Structural Intervention Distance (SID) for Evaluating Causal Graphs, Jonas Peters, Peter Bühlmann: https://arxiv.org/abs/1306.1043

(参考文献可上下滑动查看)

因果科学读书会第三季

由智源社区、集智俱乐部联合举办的,将主要面向两类人群:如果你从事计算机相关方向研究,希望为不同领域引入新的计算方法,通过大数据、新算法得到新成果,可以通过读书会各个领域的核心因果问题介绍和论文推荐快速入手;如果你从事其他理工科或人文社科领域研究,也可以通过所属领域的因果研究综述介绍和研讨已有工作的示例代码,在自己的研究中快速开始尝试部署结合因果的算法。读书自2021年10月24日开始,每周日上午 10:00-12:00举办,持续时间预计 2-3 个月。

详情请见:




特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
西方羡慕也没用!中俄合作超级工程曝光,从北京到莫斯科只需2天

西方羡慕也没用!中俄合作超级工程曝光,从北京到莫斯科只需2天

常高俊April工作室
2024-11-25 15:42:10
中美日激光武器距离差距断崖:美国5000米,日本1200米,中国呢

中美日激光武器距离差距断崖:美国5000米,日本1200米,中国呢

古今历史记
2024-11-25 17:27:28
掘金主帅怒批球队表现:如果你感到羞愧,你怎么会丢掉145分

掘金主帅怒批球队表现:如果你感到羞愧,你怎么会丢掉145分

懂球帝
2024-11-26 14:02:35
程序员错扔7500枚比特币,价值51亿!恼羞成怒蹲守垃圾场11年:谁帮我挖到就分钱!

程序员错扔7500枚比特币,价值51亿!恼羞成怒蹲守垃圾场11年:谁帮我挖到就分钱!

英国报姐
2024-11-25 21:23:27
Baby杨颖咋又变脸了,嘴巴歪、微笑唇异常,戴5千块帽子依旧富婆

Baby杨颖咋又变脸了,嘴巴歪、微笑唇异常,戴5千块帽子依旧富婆

花花lo先森
2024-11-26 14:06:41
美国特训,丁彦雨航重回CBA,下家3选1,黑马或提前抢签

美国特训,丁彦雨航重回CBA,下家3选1,黑马或提前抢签

东球弟
2024-11-26 12:42:28
鉴宝|黑丝蓝衣战神,水一样的大桃子!

鉴宝|黑丝蓝衣战神,水一样的大桃子!

贵圈真乱
2024-11-26 12:50:57
张学良晚年谈国共两党:蒋介石喜用奴才,毛主席天生能领导

张学良晚年谈国共两党:蒋介石喜用奴才,毛主席天生能领导

醉饮前山
2024-11-26 09:07:32
乳癌恢复期的李菁菁带女儿吃烧卖,暴瘦心事重重,娃却只顾刷手机

乳癌恢复期的李菁菁带女儿吃烧卖,暴瘦心事重重,娃却只顾刷手机

花花lo先森
2024-11-26 14:28:54
两性:男人“羞羞”为什么冲刺几下特别重?完事还要顶两下

两性:男人“羞羞”为什么冲刺几下特别重?完事还要顶两下

喜马拉雅主播暮霭
2024-06-18 00:08:41
最高温可达28℃!湖南要升温了!时间就在......

最高温可达28℃!湖南要升温了!时间就在......

怀化新闻网
2024-11-26 11:59:12
“列强无不怀念我大清”真实上演,加拿大女政客彻底不装了!

“列强无不怀念我大清”真实上演,加拿大女政客彻底不装了!

娱乐的小灶
2024-11-25 19:16:54
蒋介石在浙江别墅午睡,40分钟醒来后江山已易主,他崩溃痛哭

蒋介石在浙江别墅午睡,40分钟醒来后江山已易主,他崩溃痛哭

华人星光
2024-11-25 15:50:49
字节跳动真的太懂程序员了!

字节跳动真的太懂程序员了!

码农翻身
2024-11-26 08:58:45
何小鹏:我今年在小米的股票赚到钱了,特别开心|《封面》对话

何小鹏:我今年在小米的股票赚到钱了,特别开心|《封面》对话

凤凰网财经plus
2024-11-26 14:16:36
冬天它虽便宜,但便宜也要多吃,营养胜过大鱼大肉,不知道就亏了

冬天它虽便宜,但便宜也要多吃,营养胜过大鱼大肉,不知道就亏了

美食达人计划
2024-11-24 23:21:11
我靠,华为刚公布的新技术,真的太拼了

我靠,华为刚公布的新技术,真的太拼了

3C毒物
2024-11-26 08:41:29
如果男人不喝酒(说得太精辟!)

如果男人不喝酒(说得太精辟!)

读史
2024-11-23 07:00:50
华为Mate 70整机性能暴增40%:搭载全新硬件、预装原生鸿蒙系统!

华为Mate 70整机性能暴增40%:搭载全新硬件、预装原生鸿蒙系统!

快科技
2024-11-26 16:53:18
俄中将被英国导弹炸死之后,乌军准备袭击至少200个俄本土目标

俄中将被英国导弹炸死之后,乌军准备袭击至少200个俄本土目标

山河路口
2024-11-24 20:25:26
2024-11-26 17:07:00
集智俱乐部
集智俱乐部
科普人工智能相关知识技能
4787文章数 4610关注度
往期回顾 全部

科技要闻

Mate70售5499起,余承东:对得起那四个字

头条要闻

中国铁建投资集团副总马建军被指坠楼身亡 公司回应

头条要闻

中国铁建投资集团副总马建军被指坠楼身亡 公司回应

体育要闻

37岁,他用“半条右腿”重返巅峰

娱乐要闻

分手复合又打胎,黄晓明说希望是一场梦

财经要闻

洪灏刘煜辉对谈实录 涉及A股、债务等!

汽车要闻

第五代胜达 2.0T动力20万就能拿 专业空间选手

态度原创

教育
艺术
房产
本地
公开课

教育要闻

五年级,很多学生都无从下笔,尖子生直接口算答案

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

房产要闻

合生把上百个亿万富豪搞破防了

本地新闻

城市24小时|领跑万亿城市,武汉“开挂”了?

公开课

一块玻璃,如何改变人类世界?

无障碍浏览 进入关怀版