网易首页 > 网易号 > 正文 申请入驻

因果发现工具箱

0
分享至

导语

Causal Discovery Toolbox (cdt)是一个应用于图模型和Pyhton >=3.5 版本中的因果推断工具箱。包含了图结构恢复和相关依赖。该工具箱基于以下模块和语言构建:Numpy、Sciki-learn、Pytorch、R。

该工具箱包含了很多基于观测数据进行图结构恢复的算法(诸如 bnlearn、pcalg 算法)。

Leo| 编译

邓一雪| 编辑

文档题目: Causal Discovery Toolbox Documentation ‒ Causal Discovery Toolbox 0.5.23 documentation 文档链接:: https://fentechsolutions.github.io/CausalDiscoveryToolbox/html/index.html

Docker 镜像

该工具箱提供了Docker镜像,镜像中包含了所有依赖和启动项。

安装

需要版本号不低于 3.5 的Pyhton,以及 requirements.txt 中所列举出的模块。如果需要使用额外的功能则需要安装更多的模块。在安装指南中可以看到最小安装和完全安装的方式。

注意:对于非专业用户而言,(mini/ana) conda 框架有助于管理相关依赖。请查阅官网 http://pytorch.org 获取相关的配置信息。

安装 PyTorch

由于cdt(CausalDiscoveryToolbox)模块模块中的关键算法使用了 PyTorch 模块,所以需要安装PyTorch。

通过 PyPi 安装 CausalDiscoveryToolbox

可通过PyPi安装相关模块:

pip install cdt

也可以通过源代码安装

$ git clone https://github.com/FenTechSolutions/CausalDiscoveryToolbox.git # Download the package

$ cd CausalDiscoveryToolbox

$ pip install -r requirements.txt # Install the requirements

$ python setup.py install develop --user

安装完成后就可以导入运行模块。CausalDiscoveryToolbox 中的大多数算法应该都可以使用,不可用的算法会看到警告。

可通过一下方式导入模块:

import cdt

文档中包含了该模块的额外信息:

https://github.com/FenTechSolutions/CausalDiscoveryToolbox/blob/master/documentation.md

R语言与R语言库

如果要在使用 cdt 模块中,使用诸如 nlearn、kpcalg、pcalg 等由 R 语言编写的的算法,就需要安装 R 语言。

travis.yml 文件的预安装部分可以查看基于 Debian 的R语言安装依赖。r-requirements 文件则包含了 cdt 模块所需要的 R 语言包。

文件总览

模块包结构

下图展现了相关的模块与算法包结构

硬件与算法设置

该工具箱有一个SETTING类可用于对硬件进行设置。这些设置是唯一的。默认参数定义于cdt/utils/Settings

可以通过一下代码访问并修改配置

import cdt

cdt.SETTINGS

此外在启动时,可以使用 cdt.utils.Settings.autoset_settings 方法来自动配置硬件参数(例如,GPU,CPU数量,可选软件包的数量)

图类

相关模块用到了两个基于 networkx 的类,分别是:DiGraph 和 Graph。

参考

[1] Wang, S., Nan, B., Rosset, S., & Zhu, J. (2011). Random lasso. The annals of applied statistics, 5(1), 468.

[2] Friedman, J., Hastie, T., & Tibshirani, R. (2008). Sparse inverse covariance estimation with the graphical lasso. Biostatistics, 9(3), 432-441.

[3] Yamada, M., Jitkrittum, W., Sigal, L., Xing, E. P., & Sugiyama, M. (2014). High-dimensional feature selection by feature-wise kernelized lasso. Neural computation, 26(1), 185-207.

[4] Feizi, S., Marbach, D., Médard, M., & Kellis, M. (2013). Network deconvolution as a general method to distinguish direct dependencies in networks. Nature biotechnology, 31(8), 726-733.

[5] Guyon, I., Weston, J., Barnhill, S., & Vapnik, V. (2002). Gene selection for cancer classification using support vector machines. Machine learning, 46(1), 389-422.

[6] Vapnik, V., Golowich, S. E., & Smola, A. J. (1997). Support vector method for function approximation, regression estimation and signal processing. In Advances in neural information processing systems (pp. 281-287).

[7] Kira, K., & Rendell, L. A. (1992, July). The feature selection problem: Traditional methods and a new algorithm. In Aaai (Vol. 2, pp. 129-134).

[8] MacKay, D. J. (1992). Bayesian interpolation. Neural Computation, 4, 415–447.

[9] Neal, R. M. (1996). Bayesian learning for neural networks. No. 118 in Lecture Notes in Statistics. New York: Springer.

[10] Gretton, A., Bousquet, O., Smola, A., & Scholkopf, B. (2005, October). Measuring statistical dependence with Hilbert-Schmidt norms. In ALT (Vol. 16, pp. 63-78).

[11] Vinh, N. X., Epps, J., & Bailey, J. (2010). Information theoretic measures for clusterings comparison: Variants, properties, normalization and correction for chance. Journal of Machine Learning Research, 11(Oct), 2837-2854.

[12] Goudet, O., Kalainathan, D., Caillou, P., Lopez-Paz, D., Guyon, I., Sebag, M., ... & Tubaro, P. (2017). Learning functional causal models with generative neural networks. arXiv preprint arXiv:1709.05321.

[13] Spirtes, P., Glymour, C., Scheines, R. (2000). Causation, Prediction, and Search. MIT press.

[14] Hoyer, P. O., Janzing, D., Mooij, J. M., Peters, J., & Schölkopf, B. (2009). Nonlinear causal discovery with additive noise models. In Advances in neural information processing systems (pp. 689-696).

[15] Janzing, D., Mooij, J., Zhang, K., Lemeire, J., Zscheischler, J., Daniušis, P., ... & Schölkopf, B. (2012). Information-geometric approach to inferring causal directions. Artificial Intelligence, 182, 1-31.

[16] Lopez-Paz, D., Muandet, K., Schölkopf, B., & Tolstikhin, I. (2015, June). Towards a learning theory of cause-effect inference. In International Conference on Machine Learning (pp. 1452-1461).

[17] Lopez-Paz, D., Nishihara, R., Chintala, S., Schölkopf, B., & Bottou, L. (2017, July). Discovering causal signals in images. In Proceedings of CVPR.

[18] Stegle, O., Janzing, D., Zhang, K., Mooij, J. M., & Schölkopf, B. (2010). Probabilistic latent variable models for distinguishing between cause and effect. In Advances in Neural Information Processing Systems (pp. 1687-1695).

[19] Zhang, K., & Hyvärinen, A. (2009, June). On the identifiability of the post-nonlinear causal model. In Proceedings of the twenty-fifth conference on uncertainty in artificial intelligence (pp. 647-655). AUAI Press.

[20] Fonollosa, J. A. (2016). Conditional distribution variability measures for causality detection. arXiv preprint arXiv:1601.06680.

[21] Gretton, A., Borgwardt, K. M., Rasch, M. J., Schölkopf, B., & Smola, A. (2012). A kernel two-sample test. Journal of Machine Learning Research, 13(Mar), 723-773.

[22] Li, Y., Swersky, K., & Zemel, R. (2015). Generative moment matching networks. In Proceedings of the 32nd International Conference on Machine Learning (ICML-15) (pp. 1718-1727).

[23] Margaritis D (2003). Learning Bayesian Network Model Structure from Data . Ph.D. thesis, School of Computer Science, Carnegie-Mellon University, Pittsburgh, PA. Available as Technical Report CMU-CS-03-153

[24] Tsamardinos I, Aliferis CF, Statnikov A (2003). “Algorithms for Large Scale Markov Blanket Discovery”. In “Proceedings of the Sixteenth International Florida Artificial Intelligence Research Society Conference”, pp. 376-381. AAAI Press.

[25] Tsamardinos I, Aliferis CF, Statnikov A (2003). “Time and Sample Efficient Discovery of Markov Blankets and Direct Causal Relations”. In “KDD ’03: Proceedings of the Ninth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining”, pp. 673-678. ACM. Tsamardinos I, Brown LE, Aliferis CF (2006). “The Max-Min Hill-Climbing Bayesian Network Structure Learning Algorithm”. Machine Learning,65(1), 31-78.

[26] Kalainathan, Diviyan & Goudet, Olivier & Guyon, Isabelle & Lopez-Paz, David & Sebag, Michèle. (2018). SAM: Structural Agnostic Model, Causal Discovery and Penalized Adversarial Learning.

[27] Aragam, B., & Zhou, Q. (2015). Concave penalized estimation of sparse Gaussian Bayesian networks. Journal of Machine Learning Research, 16, 2273-2328.

[28] Bloebaum, P., Janzing, D., Washio, T., Shimizu, S., & Schoelkopf, B. (2018, March). Cause-Effect Inference by Comparing Regression Errors. In International Conference on Artificial Intelligence and Statistics (pp. 900-909).

[29] Structural Intervention Distance (SID) for Evaluating Causal Graphs, Jonas Peters, Peter Bühlmann: https://arxiv.org/abs/1306.1043

(参考文献可上下滑动查看)

因果科学读书会第三季

由智源社区、集智俱乐部联合举办的,将主要面向两类人群:如果你从事计算机相关方向研究,希望为不同领域引入新的计算方法,通过大数据、新算法得到新成果,可以通过读书会各个领域的核心因果问题介绍和论文推荐快速入手;如果你从事其他理工科或人文社科领域研究,也可以通过所属领域的因果研究综述介绍和研讨已有工作的示例代码,在自己的研究中快速开始尝试部署结合因果的算法。读书自2021年10月24日开始,每周日上午 10:00-12:00举办,持续时间预计 2-3 个月。

详情请见:




特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

/阅读下一篇/

空域的涌现:集群 | 涌现动力学第六课

返回网易首页 下载网易新闻客户端
相关推荐
热点推荐
严重违纪违法,何庆明被开除党籍!

严重违纪违法,何庆明被开除党籍!

鲁中晨报
2025-06-09 06:50:38
连马云都想不通,为啥越来越多老百姓选择微信支付,放弃支付宝?

连马云都想不通,为啥越来越多老百姓选择微信支付,放弃支付宝?

深析古今
2025-06-07 08:18:10
3名女子给男同事下药,并带他们到酒店强奸,被捕后:好帅

3名女子给男同事下药,并带他们到酒店强奸,被捕后:好帅

跳跳历史
2025-05-20 14:43:45
某“民族品牌”再次出丑,这下终于遮不住了

某“民族品牌”再次出丑,这下终于遮不住了

末名先生
2025-06-06 17:49:40
韦神“出关”才三天,风向却变了,同学实名喊北大书记,对他好点

韦神“出关”才三天,风向却变了,同学实名喊北大书记,对他好点

深析古今
2025-06-08 16:25:03
惨不忍睹!5月合资新能源暴跌:上汽大众下滑42%,一汽丰田跌78%

惨不忍睹!5月合资新能源暴跌:上汽大众下滑42%,一汽丰田跌78%

小鹏财经
2025-06-08 11:21:19
马上停止这“6种运动”,容易加速心脏受伤,千万别拿健康开玩笑

马上停止这“6种运动”,容易加速心脏受伤,千万别拿健康开玩笑

素衣读史
2025-06-04 11:22:13
著名学者高志凯“中印应以恒河为界”的提议极具深意!

著名学者高志凯“中印应以恒河为界”的提议极具深意!

解筱文
2025-06-07 12:05:09
黄多多这体态真好,这臂展 腕线都过档了,适合练舞吧

黄多多这体态真好,这臂展 腕线都过档了,适合练舞吧

阿废冷眼观察所
2025-06-08 19:29:29
美媒:美国恢复处理哈佛国际学生签证

美媒:美国恢复处理哈佛国际学生签证

新京报
2025-06-08 09:16:06
央妈突发降息的牛市,6月9日,凌晨的三大重要消息冲击市场!

央妈突发降息的牛市,6月9日,凌晨的三大重要消息冲击市场!

风口招财猪
2025-06-09 01:40:11
浙江:女子2天没钱吃饭,饿得躺地上无法起身,女子:找不到工作

浙江:女子2天没钱吃饭,饿得躺地上无法起身,女子:找不到工作

娱乐帝皇丸
2025-06-09 04:51:12
938球!40岁C罗连场破门,葡萄牙点球翻盘西班牙,时隔6年再夺冠

938球!40岁C罗连场破门,葡萄牙点球翻盘西班牙,时隔6年再夺冠

侃球熊弟
2025-06-09 03:48:00
巴厘岛泡泡玛特门店因Labubu爆发肢体冲突,场面一度失控

巴厘岛泡泡玛特门店因Labubu爆发肢体冲突,场面一度失控

潇湘晨报
2025-06-08 19:28:14
马斯克红着眼快哭了:不在乎与特朗普翻脸赔钱,反正都亏一千亿了

马斯克红着眼快哭了:不在乎与特朗普翻脸赔钱,反正都亏一千亿了

桑未落
2025-06-08 10:22:49
樊振东又发文了,网友直呼:连看两篇,文笔比AI都好

樊振东又发文了,网友直呼:连看两篇,文笔比AI都好

丫头舫
2025-06-08 21:57:38
行业震动!比亚迪正式回应“常压油箱”问题,某些车企下手真狠

行业震动!比亚迪正式回应“常压油箱”问题,某些车企下手真狠

IT大智
2025-06-08 23:29:42
成都闹市区深夜发生一起交通事故,目击者称有共享单车被碾成两截

成都闹市区深夜发生一起交通事故,目击者称有共享单车被碾成两截

现代快报
2025-06-08 12:59:02
厉害了!广东高考人数再创新高,网友:出奇一致,大家都不想出省!

厉害了!广东高考人数再创新高,网友:出奇一致,大家都不想出省!

特特农村生活
2025-06-08 16:47:57
演员夏馨雨竟然感谢大英博物馆保护文物?现被禁言,更多黑料被扒

演员夏馨雨竟然感谢大英博物馆保护文物?现被禁言,更多黑料被扒

蜜桔娱乐
2025-06-06 12:14:22
2025-06-09 08:31:00
集智俱乐部 incentive-icons
集智俱乐部
科普人工智能相关知识技能
5149文章数 4638关注度
往期回顾 全部

科技要闻

马斯克"越红线",美政府急寻SpaceX替代品

头条要闻

李在明上任加码尖端科技 韩国半导体产业面临三重挑战

体育要闻

冠军高芙:只要专注自己 太阳就会照常升起

娱乐要闻

与前妻对簿公堂却暴露了张纪中的窘境

财经要闻

暴涨超9%!白银狂飙,“抢夺”黄金光环!

汽车要闻

复古造型乐趣依旧 宝马R12 nineT又帅又好骑

态度原创

数码
旅游
亲子
游戏
军事航空

数码要闻

雷神推 JQ24F240L 显示器:23.8 英寸 2K 240Hz 屏,首发 899 元

旅游要闻

热闻|清明假期将至,热门目的地有哪些?

亲子要闻

妈妈的爱比世界早到一年

Sky视频评论区正面对线,TeD和浪漫咋回事?

军事要闻

洛杉矶冲突加剧 特朗普派出2000名国民警卫队