尽管生物体中的每个细胞都含有相同的基因,但并非所有基因都是每个细胞或始终都需要的。顺式调控元件 (CRE)在基因表达的时空模式中扮演着关键角色,决定了细胞和组织的身份和功能。例如,CRE 有助于确保大脑所需的基因不会被皮肤细胞使用,或者早期发育所需的基因不会在成人体内被激活。CRE 本身不是基因的一部分,通常位于它们所控制的基因附近。
人类基因组中有数千种不同的 CRE,每种都发挥着不同的作用。程序化、高精度、细胞类型特异性的 CRE 将有助于开发专门的报告基因、CRISPR 疗法、基因替代方法等。
近日,来自杰克逊实验室、博德研究所以及耶鲁大学的研究人员开发了一个名为 CODA(DNA 活性计算优化)的平台,该平台使用 AI 模型高效设计了数千种具有所需特性的全新 CRE,他们可以激活大脑、肝脏或血细胞中的基因,但不会开启其他细胞类型中的这些基因。
相关文章以题为“Machine-guided design of cell-type-targeting cis-regulatory elements”发表在 Nature 期刊。
大规模并行报告基因检测(MPRA)是一种高通量技术,用于同时检测多个基因的表达或功能状态。这种技术通常用于基因组学研究,以识别和定量细胞中成千上万个基因的活性。此前的研究显示,该技术可以直接量化跨细胞类型的数十万种 CRE 的活性。
其次,深度学习方法已被证明是预测 DNA 序列与调控活性之间关系的有效工具。
该团队结合两种方式,利用来自人类基因组的数十万个 DNA 序列训练模型生成 CRE,并在三种细胞(血液、肝脏和大脑)中测试了 CRE 的活性。
他们与天然 CRE 序列比较了在目标细胞类型中激活基因的效果,以及在其他细胞中避免基因表达的效果。结果发现,新的 CRE 甚至比已知与细胞类型相关的天然 CRE 更具细胞类型特异性。
通过“湿”和“干”研究的迭代组合,研究人员首先使用实验数据构建计算模型,然后验证计算模型,改进并提高了该程序预测每种 CRE 生物学影响的能力,并能够设计出自然界中从未见过的特定 CRE。
团队也研究了为什么合成的 CRE 能够胜过天然的 CRE,并发现细胞特异性的合成 CRE 包含了负责在目标细胞类型中表达基因的序列组合,以及在其他细胞类型中抑制或关闭基因的序列。
最后,该团队在斑马鱼和小鼠身上测试了几种合成的 CRE 序列,并取得了良好的结果。例如,一种 CRE 能够激活正在发育的斑马鱼肝脏中的荧光蛋白,但无法激活鱼的任何其他部位。
这项技术为编写具有预定义功能的新调控元件铺平了道路。此类工具不仅对基础研究很有价值,而且可能具有重要的生物医学意义,可以使用这些元件来控制特定细胞类型中的基因表达,以达到治疗目的。
1.Gosai SJ, Castro RI, et al. Machine-guided design of cell type-specific cis-regulatory elements. Nature. Online October 23, 2024. DOI: 10.1038/s41586-024-08070-z.
免责声明:本文旨在传递生命科学和医疗健康产业最新讯息,不代表平台立场,不构成任何投资意见和建议,以官方/公司公告为准。本文也不是治疗方案推荐,如需获得治疗方案指导,请前往正规医院就诊。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.