网易首页 > 网易号 > 正文 申请入驻

预测准确率达95.7%,ChatMOF利用LLM预测和生成金属有机框架

0
分享至

编辑|X

金属有机框架(MOF)因其孔隙率大、表面积大和出色的可调性而用于许多化学应用。然而,在利用 AI 深入探索 MOF 设计与性能优化的研究征途中,科学家们正面临着前所未有的挑战。

去年 3 月,韩国科学技术院(Korea Advanced Institute of Science and Technology,KAIST)的研究人员提出的MOFTransformer 模型经过一百万个假设的 MOF 的预训练,在预测各种属性方面表现出色。

近日,KAIST 团队提出了一种 AI 系统——ChatMOF,用于预测和生成 MOF。通过利用大语言模型 (GPT-4、GPT-3.5-turbo 和 GPT-3.5-turbo-16k),ChatMOF 从文本输入中提取关键细节并提供适当的响应,从而无需进行严格而正式的结构化查询。

ChatMOF 由三个核心组件组成(即智能体、工具包和评估器),它形成了一个强大的管道,可管理各种任务,包括数据检索、属性预测和结构生成。ChatMOF 的搜索准确率高达 96.9%,预测准确率高达 95.7%。此外,它还成功地从自然语言中创建了具有用户所需属性的材料。

该研究进一步探讨了在材料科学中使用大型语言模型 (LLM) 与数据库和机器学习结合的优点和局限性,并展示了其对未来进步的变革潜力。

相关研究以「ChatMOF: an artificial intelligence system for predicting and generating metal-organic frameworks using large language models」为题,于 6 月 3 日发布在《Nature Communications》上。

论文链接:https://www.nature.com/articles/s41467-024-48998-4

生成式 AI 领域正在经历前所未有的激增,尤其是 LLM 的兴起,它们能处理文本数据、模仿人类认知某些方面的任务,例如基于少样本和零样本学习来处理和应用新信息。

尽管 LLM 在化学、医学等领域取得进展,但在材料科学中的潜力尚未充分挖掘,主要受材料复杂性和缺乏专业训练数据限制。这一限制主要源于两个重大挑战。首先,这些先进材料(如 MOF)的固有复杂性构成了重大障碍。其次,该领域材料特定的训练数据明显稀缺。

在此,研究人员提出ChatMOF 用于自动生成新材料并预测其属性。该系统能根据基于文本的查询预测 MOF 属性并生成具有指定属性的 MOF (即逆向设计)。

ChatMOF 的设计

自主 LLM 智能体的有效性取决于其能够准确地从文本输入中提取基本细节并提供相关响应,而不管是否存在严格结构化的查询。

ChatMOF 清楚地说明了这一概念。用户可以以文本形式提出有关材料属性的查询,ChatMOF 通过提供与所讨论材料相关的详细描述来响应该查询。此外,该系统的操作范围超出了简单的信息检索。当用户表示需要生成具有特定属性的 MOF 时,ChatMOF 能够相应地生成请求的材料结构。

图示:ChatMOF 的概念和示意图。(来源:论文)

在 ChatMOF 的背景下,LLM 充当中央协调器,管理和评估流程,类似于中央处理单元 (CPU) 在计算中的运行方式。ChatMOF 使用 LLM 系统地组织和应用各种工具来收集信息,类似于计算机编程中执行良好的算法。这种协同作用使系统能够精确预测材料属性,从文本挖掘数据库中检索合成方法,并制造具有预设属性的新材料。

ChatMOF 由三个主要组件组成:智能体、工具包和评估器。智能体通过四个主要操作阶段(即数据分析、操作确定、输入管理和结果观察)处理人类查询。

首先,将用户的查询确立为目标,然后进行系统规划以确定实现此目标的步骤。随后,ChatMOF 从可用选项中决定使用哪种合适的工具。执行所选工具后,观察到的结果将作为评估是否可以生成最终答案的基础。如果可行,则提供最终答案,否则,该过程将循环回到思考步骤以制定新策略。

四类工具包

ChatMOF 使用各种工具来获取、预测或生成材料信息。这些工具主要可分为四类:表格搜索器、互联网搜索器、预测器、生成器和实用程序。

如果用户查找有关 MOF 数据库中包含的特定 MOF 的信息,ChatMOF 可以从预先制表的数据中找到并提供所需的信息。下图为 ChatMOF 进行的表搜索操作的说明性示例。

图示:表格搜索器针对问题「LITDAV 的密度与其他材料相比如何」的示例。(来源:论文)

作为预测任务的合适工具,ChatMOF 使用该小组之前开发的 MOFTransformer 模型,用于 MOF 性质的通用预测。

下图展示了使用 MOFTransformer 预测器的 ChatMOF 示例提示。

图示:「找到在 77 K, 1 bar 时氢扩散率最高的 MOF」问题的预测器示例。(来源:论文)

最后,MOF 领域研究人员的一个主要愿望是逆向设计表现出所需特性的 MOF。遗传算法特别适合与 LLM 集成。作为一种受生物启发的优化方法,遗传算法基于选择、突变和交叉原理运行,使其具有适应性且效率高。下图展示了 ChatMOF 利用遗传算法根据用户规范制作 MOF。

图示:针对「你能生成具有最大表面积的结构吗」这一问题生成器的示例。(来源:论文)

此外,ChatMOF 被设计用于执行多种实用程序,这些实用程序超出了 LLM 的范围。这包括文件搜索、互联网搜索甚至简单计算等功能。

图示:一个复杂且多步骤问题的示例「给出 XEGKUR 在 298 K 时的 CO2 亨利系数」。(来源:论文)

ChatMOF 性能评估

为了评估 ChatMOF 的性能,对「搜索任务」、「预测任务」和「生成任务」进行了分析。为了进行评估,使用 GPT-4 创建了 ChatMOF 问题,以生成有关 MOF 给定属性的各种句子。

ChatMOF 的准确性分析涉及使用三个标签:「真」、「假(超出 token 限制)」和「假(逻辑错误)」。

下图展示了使用 ChatMOF 和 GPT-4 完成的三项任务的准确度测量。对搜索和预测任务的 100 个样本问题和生成任务的 10 个样本问题进行了准确性测量。ChatMOF 的搜索准确率高达 96.9%,预测准确率高达 95.7%。对于生成任务,准确率为 87.5%。

图示:使用 GPT-4 模型(搜索、预测和生成)执行三个任务的准确度描述(于 2023.08.10 至 2023.08.14 测试)。

此外,ChatMOF 与 GPT-4 集成时的性能也优于与 GPT-3.5-turbo 集成时的性能。

逆向设计验证

ChatMOF 通过规划遗传算法和执行遗传算法进行材料逆向设计。在逆向设计方面表现出相当高的准确性(7/10),规划过程中的主要错误是在选择亲本基因(parent gene)时遇到的。执行阶段中,GPT-4 表现优于 GPT-3.5-turbo,能生成较少重复的后代,尽管生成数量不稳定。

图示:ChatMOF 进行的 MOF 逆向设计分析。(来源:论文)

尽管如此,ChatMOF 已成功生成满足用户要求的材料,如高比表面积和指定氢气吸附量的结构,且预测值与优化后实验结果接近,显示出方法的有效性。

局限性

尽管 ChatMOF 取得了成功,但它的生成任务确实存在一些局限性。其中最主要的是由于输入和输出 token 的限制导致基因多样性下降。其他限制,例如拓扑和循环数量有限,源于资源和时间限制。

然而,尽管存在这些限制,ChatMOF 的算法仍能有效地生成与目标函数高度一致的 MOF,证明了其操作有效性。ChatMOF 代表了在材料科学领域实现 AI 更高自主性方面取得的重大进展。随着技术的进步,以及模型容量和在线平台数据共享的结构化改进,ChatMOF 的性能可以进一步优化,从而促进 MOF 研究取得显著进展。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
几乎全是假货!利润高达2400%,咋消费者还前赴后继争相购买?

几乎全是假货!利润高达2400%,咋消费者还前赴后继争相购买?

奇思妙想草叶君
2026-01-05 23:13:15
亚布塞莱:我希望能在NBA打5年,这样我的家人能享受终身医保

亚布塞莱:我希望能在NBA打5年,这样我的家人能享受终身医保

懂球帝
2026-01-06 16:29:06
再见皇马!1.8亿巨星翻脸,英超豪门送顶级报价,冲金球打脸佛爷

再见皇马!1.8亿巨星翻脸,英超豪门送顶级报价,冲金球打脸佛爷

阿泰希特
2026-01-06 12:33:15
四川一医院收费员玩手机,窗口多人排队待缴费,医院确认属实,已对涉事职工进行严肃批评教育和待岗处理

四川一医院收费员玩手机,窗口多人排队待缴费,医院确认属实,已对涉事职工进行严肃批评教育和待岗处理

都市快报橙柿互动
2026-01-07 00:48:56
天塌了?婚礼电子请柬可查看访客记录,有人反复看了24次请柬,平台:会员才能查看全部记录

天塌了?婚礼电子请柬可查看访客记录,有人反复看了24次请柬,平台:会员才能查看全部记录

极目新闻
2026-01-06 16:19:41
委空军基地遭美袭击后 导弹碎片四散

委空军基地遭美袭击后 导弹碎片四散

极目新闻
2026-01-07 00:06:50
23岁中国女导演在柬埔寨坠亡,其父已经赴柬,警方在案发现场栏杆上提取到指纹痕迹

23岁中国女导演在柬埔寨坠亡,其父已经赴柬,警方在案发现场栏杆上提取到指纹痕迹

红星新闻
2026-01-05 23:27:24
一记重锤!中国打疼日本“七寸”,商务部:禁止对日军事两物出口

一记重锤!中国打疼日本“七寸”,商务部:禁止对日军事两物出口

科普100克克
2026-01-06 21:44:08
住建部已摸清国内房子数量,过剩严重到什么程度?楼市迎来大变局

住建部已摸清国内房子数量,过剩严重到什么程度?楼市迎来大变局

复转这些年
2026-01-06 23:53:39
最讨厌的演员排名,潘长江仅第五,闫学晶第二,第一毋庸置疑

最讨厌的演员排名,潘长江仅第五,闫学晶第二,第一毋庸置疑

林雁飞
2026-01-04 19:29:51
福建20岁女网红流落柬埔寨街头,毒品检测呈阳性;其父亲称女儿近期有望回家,手续办完自己过去接

福建20岁女网红流落柬埔寨街头,毒品检测呈阳性;其父亲称女儿近期有望回家,手续办完自己过去接

大风新闻
2026-01-06 14:08:04
震惊!清远一注册资本1亿的陶瓷厂,拖欠700多员工9个月工资没发

震惊!清远一注册资本1亿的陶瓷厂,拖欠700多员工9个月工资没发

火山詩话
2026-01-06 19:13:44
演员朱碧云现状:美国精英生活,63岁依旧美丽,儿子成骄傲

演员朱碧云现状:美国精英生活,63岁依旧美丽,儿子成骄傲

秋狝春苗梦
2026-01-06 17:36:54
艾滋病新增130万!很多人中招很冤枉!在外“5不碰”一定要记死

艾滋病新增130万!很多人中招很冤枉!在外“5不碰”一定要记死

今朝牛马
2025-12-31 19:31:04
H灯+初恋脸!这位业界'宅男女神'的起起落落,比漫画还精彩!

H灯+初恋脸!这位业界'宅男女神'的起起落落,比漫画还精彩!

素然追光
2026-01-06 02:41:31
伊朗有大事要发生: 至少29名抗议者被杀、88个城市被点燃

伊朗有大事要发生: 至少29名抗议者被杀、88个城市被点燃

一种观点
2026-01-06 09:46:56
马杜罗被抓,奸细身份曝光?代总统暴露真面目,美还要对4国动手

马杜罗被抓,奸细身份曝光?代总统暴露真面目,美还要对4国动手

博览历史
2026-01-06 05:10:03
你扣我油轮,我没收你军火,中方强势登船,敢运海马斯就来试试

你扣我油轮,我没收你军火,中方强势登船,敢运海马斯就来试试

起喜电影
2026-01-07 05:43:16
7800元滑雪夹克“秒没”到原价转让,始祖鸟马年限定遇冷 高端户外还能卖多久“身份感”?

7800元滑雪夹克“秒没”到原价转让,始祖鸟马年限定遇冷 高端户外还能卖多久“身份感”?

每日经济新闻
2026-01-06 21:20:04
主持人高黎之去世,年仅52岁,当天上午还好好的,好友透露细节

主持人高黎之去世,年仅52岁,当天上午还好好的,好友透露细节

180视角
2026-01-05 14:55:47
2026-01-07 07:19:00
ScienceAI incentive-icons
ScienceAI
关注人工智能与其他前沿技术
1199文章数 223关注度
往期回顾 全部

科技要闻

速看!黄仁勋万字实录:甩出"物理AI"王牌

头条要闻

特朗普:若输中期选举 我可能被弹劾

头条要闻

特朗普:若输中期选举 我可能被弹劾

体育要闻

从NBA最菜首发控卫,到NBA最强乔治

娱乐要闻

2026年央视春晚彩排照曝光!

财经要闻

50万亿存款"洪流"将至 四大去向引关注

汽车要闻

摩登出街潮品 实拍奇瑞QQ冰淇淋女王版

态度原创

家居
健康
数码
游戏
公开课

家居要闻

引光之宅 地下室也有生机

这些新疗法,让化疗不再那么痛苦

数码要闻

一口气看完科沃斯 CES2026 新品:地面、窗面、草坪、泳池全覆盖

猎魂世界:最新版全武魂强度评级及养成汇总攻略!(1.4)

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版