网易首页 > 网易号 > 正文 申请入驻

首个基于Al和MD的CRISPR脱靶效应预测和sgRNA优化模型CRISOT

0
分享至

CRISPR 基因编辑技术已经被广泛应用于生命科学的各个领域,但美中不足的是其存在脱靶效应,限制了该技术在临床上的应用。而且由于对 CRISPR 分子机制的理解不够深入,现有的计算工具在全基因组脱靶预测方面也不甚理想。

为了解决该问题,同济大学生命科学与技术学院生物信息学系、同济大学-上海自主智能无人系统科学中心刘琦教授课题组,联合之江实验室、罗氏上海创新中心和中国农业科学院等团队在最新的一项研究中,提出将分子动力学(MD)模拟整合到 CRISPR 系统的计算分析中。他们开发了一个名为 CRISOT 的综合工具套件,其中包含四个相互关联的模块:CRISOT-FP、CRISOT-Score、CRISOT-Spec 和 CRISOT-Opti。这些模块分别用于 RNA-DNA 分子相互作用指纹生成、全基因组 CRISPR 脱靶预测、sgRNA 靶向特异性评估以及 Cas9 系统的 sgRNA 优化。全面的计算和实验测试表明 CRISOT 在计算机验证和概念验证实验中的表现优于现有的工具。

日前,该研究以“Genome-wide CRISPR off-target prediction and optimization using RNA-DNA interaction fingerprints”为题,发表在《自然·通讯》上。

克服脱靶效应

像 CRISPR-Cas9 系统这样的由 RNA 指导的基因组编辑系统,在生物学和医学等领域有着广泛的应用。虽然它能够进行精确的基因组编辑,但如何避免脱靶效应却成为了一个巨大的挑战。研究表明,Cas9 酶能够容忍一定数量的碱基对错配,这意味着在基因组中可能存在一些与 sgRNA 不完全互补的位点,这些位点成为了潜在的脱靶位点。脱靶效应可能会导致潜在的副作用,从而阻碍 CRISPR 系统的进一步发展和临床应用。因此,对于研究人员来说,开发出更加精确、高效的基因组编辑方法是非常重要的。

为了设计出能够避免脱靶效应的 sgRNA,目前已经有不少计算机模拟工具被开发出来。这些工具大致分为由假设驱动的工具和基于机器学习的工具这两类。由假设驱动的工具使用经验规则评估脱靶效应,而基于机器学习的工具则利用机器学习模型进行预测。尽管它们有所差异,但这些工具的全基因组脱靶预测性能有限,这主要是因为对 CRISPR 分子机制的理解不够深入。Cas9 的分子机制主要包括两个基本过程:与靶序列结合形成稳定的复合物,以及两个核酸酶域的别构激活来剪切 DNA。这两个过程由 Cas9-sgRNA-DNA 复合物中的一系列分子间和分子内相互作用驱动。这些分子相互作用也可以预测 CRISPR 编辑过程,但相关研究还不多。已有研究表明,通过 Cas9-sgRNA-DNA 复合物的结合能可以更精确地预测 CRISPR 脱靶效应,但这些分子相互作用还有待进一步阐明,以改进全基因组 CRISPR 脱靶预测。

而本研究提出的 CRISOT 是一个基于 CRISPR 系统 RNA-DNA 分子相互作用的综合计算框架,用于全基因组 CRISPR 脱靶预测、评估和优化。通过分子动力学模拟,他们推导出 RNA-DNA 分子相互作用指纹,以表征 CRISPR 系统中 RNA-DNA 的底层相互作用机制。该方法可提高 CRISPR 基因组编辑的靶向特异性。

CRISOT 的概念框架

CRISOT 最初是为 CRISPR-Cas9 系统而设计,但也拓展到其他 RNA 引导的 CRISPR 系统。它利用 MD 模拟获取 RNA-DNA 杂合体的分子相互作用,并将其开发成分子互作指纹,用于开展全基因组CRISPR脱靶预测、评估和优化。CRISOT 包括四个模块:融合 AI 和分子互作指纹进行脱靶效应预测的 CRISOT-FP,快速计算脱靶打分的 CRISOT-Score,计算 sgRNA 靶向特异性得分的 CRISOT-Spec,以及进行 sgRNA 优化的 CRISOT-Opti。对于编辑效率高但靶向特异性差的 sgRNA,CRISOT-Opti 通过引入单核苷酸突变,在保持一定的靶向效应的同时,降低该 sgRNA 的脱靶效应,达到优化目的。

CRISOT-FP 归纳了 Cas9 系统中 RNA-DNA 杂合体的分子互作指纹

在 CRISOT-FP 的设计中,作者们认为 RNA-DNA 杂合体包含关于 Cas9 激活的分子相互作用信息。因此,他们设计了一系列 RNA-DNA 杂合体并进行了 MD 模拟,开发了 RNA-DNA 分子相互作用特征,并筛选了 193 个特征来编码 sgRNA-DNA 杂合体。CRISOT-FP 将每个 sgRNA 和 DNA 核苷酸对编码为 193 个分子相互作用特征,形成了位置依赖的分子互作指纹。该方法可与各种机器学习模型结合,通过捕捉 Cas9 系统中 RNA-DNA 杂合体的本质特征提高模型预测能力。

为了评估 CRISOT-FP 的性能,他们使用了来自体外全基因组脱靶检测技术的 Group I 基准数据集。并比较了 CRISOT-FP 和其他三种特征编码方法(Crista_feat、One-hot 和 Two-hot 编码)在 CRISPR 脱靶预测中的性能。CRISOT-FP 无论是在 LGO 还是 LSO 测试中都表现出色。相比之下,其他编码方法在预测脱靶效应方面表现较差。

CRISOT-FP 与 SOTA 预测方法的比较

为了进一步评估 CRISOT-FP 在独立测试数据集上的脱靶预测能力,并与当前最先进的脱靶预测方法进行比较,作者们构建了与训练数据集相互独立的 Group II 数据集,将 CRISOT-FP 与四种假设驱动的脱靶打分工具和四种基于学习的脱靶预测工具进行比较。CRISOT-FP 的打分值是前述基准研究中描述的 Group I 数据集上得到的模型的平均值。他们进行了三项基准测试,以评估 CRISOT-FP 在预测全基因组脱靶效应方面的性能。

在第一项基准测试评估中,测试了模型在预测体外实验数据集上的性能。虽然 MOFF 模型在 guideseq_listgarten 数据集上性能上与 CRISOT-FP 相当,但 CRISOT-FP 在其他数据集上均表现优异。CRISOT-FP 平均 PR-AUC 为 0.46(p < 0.05),优于其他方法。

在第二项评估中,测试了模型在细胞实验数据集上的性能。CRISOT-FP 在 PR-AUC 结果上优于所有基于学习模型和假设驱动方法(p < 0.05),可见,CRISOT-FP 在预测基因组脱靶效应方面表现出色。

在第三项评估中,测试了模型在不同灵敏度下的性能。作者将 6 个检测灵敏度应用于脱靶数据集,以获得 6 个具有不同灵敏度的数据集。结果 CRISOT-FP 在不同灵敏度的脱靶数据集方面,都优于其他方法。其性能随检测灵敏度的变化而略微提升。在上述各种比较方法中,CRISOT-FP 的 PR-AUC 结果最佳。总体上来说,CRISOT-FP 展现出强大的泛化能力,优于现有的基于机器学习的模型和假设驱动方法,能更精准预测 Cas9 的脱靶效应。

CRISOT-Score 能够提供 Cas9 系统的有效脱靶打分

通过使用 XGB 模型与 SHAP 算法,作者分析了 CRISOT-FP 中的特征重要性,发现近 PAM 端位置比远 PAM 端位置更重要,其中位置 5、8 和 9 在远 PAM 端位置中较为重要。这与之前关于 Cas9 分子机制的研究一致。他们分析了 CRISOT-FP 的关键互作特征,发现与结合稳定性相关的特征如 E_surf、resA@N1 resB@N1 和 hbond_bp5 最为重要。RNA-DNA 杂合体的曲率对 Cas9 的结合亲和力也有影响,而原子位置和结合自由能特征对模型贡献最大。此外,一些关键原子位置可能影响 Cas9 的切割活性。

随后,作者利用关键互作特征设计了一个灵活的脱靶打分函数 CRISOT-Score,使用关键互作特征对每个位置的不同碱基类型进行打分,从而得到给定 sgRNA 和 DNA 序列的脱靶打分值 CRISOT-Score。他们在 Group I 数据集上评估了选择前 1-30 个关键互作特征时 CRISOT-Score 的脱靶打分性能变化,并最终选择前 24 个关键互作特征用于开发 CRISOT-Score。

作者接下来全面评估了 CRISOT-Score 的有效性,发现其在预测脱靶现象方面优于 7 种先进的假设驱动的脱靶打分方法,包括 KinPred、CRISPRoff 等。CRISOT-Score 不仅考虑了结合自由能特征,还纳入了原子位置、氢键和碱基的几何特征,更系统地反映了 Cas9-sgRNA-DNA 复合体的相互作用。而且 CRISOT-Score 能很好地区分活性和非活性的脱靶位点。对于被实验验证的脱靶位点,其 CRISOT-Score 打分值的分布与非活性的脱靶位点具有明显的不同。最后,作者发现随着 CRISOT-Score 的增加,活性脱靶位点的频率也增加。当 CRISOT-Score 大于 0.8 时,活性脱靶位点的频率高于 0.9;而当 CRISOT-Score 低于 0.5 时,活性脱靶位点的频率几乎为 0。因此,使用 CRISOT-Score 能有效地预测脱靶位点的活性。

CRISOT-Spec 提供有效的 sgRNA 靶向特异性评估

靶向特异性打分工具根据 sgRNA 在全基因组范围内的脱靶情况评估 sgRNA 的靶向特异性。已有靶向特异性打分方法通常将所有位点的打分结果进行简单叠加,然而,作者认为更需要关注脱靶效应打分较高的位点,因为它们更有可能导致严重的脱靶效应。为了解决这个问题,他们开发了一种特异性打分方法,即 CRISOT-Spec。对于给定的 sgRNA,CRISOT-Spec 搜索其全基因组脱靶位点并计算它们的 CRISOT-Score 值。然后计算不同 CRISOT-Score 值范围内的潜在脱靶位点的数量,并将其乘以该范围内活性脱靶位点的概率。由于 CRISOT-Score 值低于 0.5 的脱靶概率几乎为零,CRISOT-Spec 主要关注 CRISOT-Score 值高于 0.5 的脱靶位点,这些是最有可能的活性脱靶位点。脱靶位点的错误编辑,即使切割效率很低,都会在临床治疗中带来很大的问题。

测试结果表明 CRISOT-Spec 在预测 sgRNA 的靶向特异性方面表现出色,并在预测 Site-seq 数据集上表现最佳,Spearman 相关系数达到 −0.853。与其它靶向特异性打分方法相比,CRISOT-Spec 显著优于 CRISPRspec、MIT 和 CFD 特异性打分,并与唯一的基于学习的方法即 MOFF-aggregate 表现相当。

CRISOT-Opti 优化 sgRNA 以减少脱靶效应

对于靶向特异性较差的 sgRNA,CRISOT-Opti 方法引入突变,并计算 CRISOT-Score 和 CRISOT-Spec 打分,根据打分情况挑选优化的 sgRNA。这样在保证目标 DNA 切割效率的同时,降低脱靶效应的风险。该方法可有效优化 sgRNA,提高 CRISPR 系统的靶向特异性和准确性。

以人类 EXM1 基因的 GAGTCCGAGCAGAAGAAGAAGGG 序列为例,使用 CRISOT-Opti 方法优化该 sgRNA。通过突变 sgRNA 并计算 CRISOT-Score 和 CRISOT-Spec 打分,可以找到具有更好靶向特异性的 A11 > C(11 位点的 A 突变为了 C)突变 sgRNA,由于 A11 > C 突变 sgRNA 的 CRISOT-Score 较高,该突变 sgRNA 仍将对其目标 DNA 保持有效的切割效率。此方法有助于在保持较高的目标 DNA 切割效率的同时降低脱靶效应的风险。

为了验证优化结果,作者进行了 Guide-seq 实验检测 WT 和 A11 > C sgRNA 的全基因组脱靶位点。结果表明,使用突变 sgRNA 降低了目标 DNA 的切割活性,但仍保持足够效率,这与之前的研究一致。同时,A11 > C sgRNA 显著减少了脱靶编辑,能够减少约 50 倍的脱靶读数和 5 倍的活性脱靶位点。优化后的 sgRNA 保护基因免受攻击,减轻 CRISPR-Cas9 系统的副作用。随后,他们使用 CRISOT-Opti 对两个重要的治疗基因 PCSK9 和 BCL11A 的 sgRNA 进行优化,并进行了 WGS 实验验证,结果表明 CRISOT-Opti 可用于优化 sgRNA,可以提高基因编辑安全性。

CRISOT 可促进碱基编辑器和碱基编辑器全基因组脱靶预测

CRISOT 是一种基于 RNA-DNA 的相互作用开发的用于预测 CRISPR 脱靶效应和优化 sgRNA 的工具,可用于提高基因编辑的安全性,同时保持 CRISPR 治疗的有效性。碱基编辑器(BEs)和先导编辑器(PEs)允许在不引发 DNA 双链断裂的情况下,对目标序列进行精确编辑,但它们也涉及 RNA-DNA 的相互作用。故 Cas9 的脱靶预测方法通常也被用于评估 BEs 和 PEs 的脱靶效应。因此,作者制作了一个独立的脱靶数据集,用于评估 CRISOT 在预测 BEs 和 PEs 的脱靶效应和目标特异性方面的性能。结果显示,CRISOT 在预测这些编辑器的脱靶效应方面优于其他方法,并且在预测靶向特异性方面也表现出色。

下一步的研究

尽管 CRISOT 取得了成功,但仍有改进空间。

首先,本研究仅考虑了具有 NGG PAMs 且无 DNA/RNA 突起的脱靶。除了典型的 NGG PAM,Cas9 也能切割具有替代 PAM 序列的脱靶,但切割速率较低。未来应考虑各种 PAM 序列和 DNA/RNA 突起导致的脱靶效应。

其次,RNA-DNA 分子相互作用特征和 CRISOT-FP 提供了对 Cas9 分子机制的深入理解,但变构和切割机制可能涉及其他分子相互作用。未来应对这些过程涉及的互作进行更全面的模拟研究。

第三,DNA 可及性特征(如染色质开放信息和 DNA 甲基化信息)可能会增强性能,但这些信息并不总是可以获取的。因此,CRISOT 工具未在此版本中考虑这些信息。

第四,作者训练了 XGB 模型,因为它们简单强大且易于训练表列数据。未来可以更灵活地整合复杂机器学习算法,特别是深度学习算法。最后,当前主要在计算上进行验证,未来进行更大规模的实验验证将使结果更具说服力。

声明:本文仅供科研分享,助力科学传播,不做盈利使用,如有侵权,请联系后台删除。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
陪玩陪睡根本不够!认干爹、舔手指,背地里的阴暗面完全藏不住了

陪玩陪睡根本不够!认干爹、舔手指,背地里的阴暗面完全藏不住了

杰丝聊古今
2026-05-03 13:35:27
穆里尼奥还没上任!皇马先赢麻了!老佛爷赚翻,传奇回归有戏了

穆里尼奥还没上任!皇马先赢麻了!老佛爷赚翻,传奇回归有戏了

奶盖熊本熊
2026-05-18 00:38:16
绕开哈国铁路动工!中方划清红线,骑墙者一律不准上车

绕开哈国铁路动工!中方划清红线,骑墙者一律不准上车

泠泠说史
2026-05-16 22:19:48
姆巴佩彻底被皇马抛弃!唯一接盘侠来了,穆里尼奥笑了

姆巴佩彻底被皇马抛弃!唯一接盘侠来了,穆里尼奥笑了

澜归序
2026-05-18 01:05:09
以色列消灭哈马斯最高军事负责人哈达德!曾策划10.7袭击

以色列消灭哈马斯最高军事负责人哈达德!曾策划10.7袭击

项鹏飞
2026-05-16 19:55:56
中央再发铁令!领导干部出现这15种情形 , 将不能再担任现职!

中央再发铁令!领导干部出现这15种情形 , 将不能再担任现职!

细说职场
2026-05-14 21:37:29
铁三女神冯竟爽穿专业服遭网暴!正面硬刚:我没问题,是你龌龊

铁三女神冯竟爽穿专业服遭网暴!正面硬刚:我没问题,是你龌龊

青杉依旧啊啊
2026-05-17 14:38:06
今年最炸的A级大片,要来了

今年最炸的A级大片,要来了

独立鱼
2026-05-16 21:16:33
笑麻了,那些外行人看来很蠢的设计,实际上却精妙无比!

笑麻了,那些外行人看来很蠢的设计,实际上却精妙无比!

另子维爱读史
2026-05-16 10:36:47
湖北省委:坚决拥护党中央决定

湖北省委:坚决拥护党中央决定

农民日报
2026-05-17 20:16:06
罗湖海关查获进境旅客在内衣和裤子口袋内藏匿替西帕肽针剂75支

罗湖海关查获进境旅客在内衣和裤子口袋内藏匿替西帕肽针剂75支

环球网资讯
2026-05-17 13:43:12
神图 | 知道为什么打不到蚊子了吧!

神图 | 知道为什么打不到蚊子了吧!

科技狐
2026-05-17 22:34:08
9战进13球!中国足球17岁1米92王牌崛起:国产克劳奇当第一射手

9战进13球!中国足球17岁1米92王牌崛起:国产克劳奇当第一射手

李喜林篮球绝杀
2026-05-17 12:32:51
特朗普急了,返美路上发飙:中国有大宴会厅,美国必须跟上!

特朗普急了,返美路上发飙:中国有大宴会厅,美国必须跟上!

混沌录
2026-05-17 17:44:42
马斯克这次访华,万万没想到,居然把联想CEO杨元庆带火了!

马斯克这次访华,万万没想到,居然把联想CEO杨元庆带火了!

趣味萌宠的日常
2026-05-17 22:00:06
用化学药水泡杨梅这事,底线彻底丢失的一幕!

用化学药水泡杨梅这事,底线彻底丢失的一幕!

胖胖说他不胖
2026-05-17 10:15:14
战伯恩利稳了?阿森纳此前10次英超对阵降级球队全胜

战伯恩利稳了?阿森纳此前10次英超对阵降级球队全胜

懂球帝
2026-05-18 07:41:36
人民大会堂服务员颜值好高,选拔标准严格,堪比选空姐

人民大会堂服务员颜值好高,选拔标准严格,堪比选空姐

童叔不飙车
2026-05-16 22:25:07
哪有软柿子,前女首富陈丽华去世1个月,“唐僧”迟重瑞现状曝光

哪有软柿子,前女首富陈丽华去世1个月,“唐僧”迟重瑞现状曝光

可乐谈情感
2026-05-17 21:05:15
这三样,特朗普一个没给!中美关系没有逆转,更狠的较量才刚开始

这三样,特朗普一个没给!中美关系没有逆转,更狠的较量才刚开始

潋滟晴方DAY
2026-05-17 09:37:12
2026-05-18 07:59:00
络绎科学 incentive-icons
络绎科学
专业的科研成果转化社区
105文章数 3关注度
往期回顾 全部

科技要闻

三大运营商即将免月租?多方回应

头条要闻

外媒:中国电动汽车即将登陆加拿大 经销商等不及了

头条要闻

外媒:中国电动汽车即将登陆加拿大 经销商等不及了

体育要闻

生死战只拿3分的核心,还有留的必要吗?

娱乐要闻

卢昱晓道歉:认识到问题严重性!

财经要闻

长鑫科技 预计上半年净利至少500亿元

汽车要闻

车长超5米/双动力可选 昊铂S600预售权益价18.89万起

态度原创

旅游
艺术
游戏
亲子
军事航空

旅游要闻

从打卡参观到深耕内涵,青年与博物馆双向奔赴

艺术要闻

24幅 当代画家静物油画作品

魔坛节奏丨古树杯120队遭绝平,中国退役WCG冠军获Blizzcon邀请

亲子要闻

小脚丫的倔强!萌娃展示超绝一字马技能 #睡个好觉

军事要闻

黎以停火再延长 空袭却未停止

无障碍浏览 进入关怀版