近日,来自广州大学和华中农业大学的研究团队在国际权威学术期刊Nucleic Acids Research上联合发表题为“SoyMD: a platform combining multi-omics data with various tools for soybean research and breeding”的研究论文。该研究通过搜集和整合大豆基因组、转录组、变异组、表观遗传学和表型组等6个组学的数据,构建出目前最为系统和全面的大豆多组学数据库SoyMD,为大豆遗传育种研究提供了重要的数据资源和分析平台。
大豆(Glycine max)作为一种多用途作物,广泛种植于世界各地,是世界上最重要的作物之一。近年来,高通量多组学技术已越来越多地应用于大豆研究和育种,积累了大量的多组学数据,也因此建立了多个大豆多组学数据库。然而,不同组学数据之间的关联、不同版本参考基因组数据的关联、以及多组学信息的整合仍相对缺乏。因此,研究人员旨在通过收集和整合包括基因组学、转录组学、表型组学、表观基因组学和变异组学等大量的多组学数据集来解决这些局限性。
研究者共搜集了38个基因组的序列和注释数据,435个组织样本基因表达数据,125份大豆表型数据、24,501份大豆材料的遗传变异数据以及包括组蛋白修饰、转录因子结合、染色体可及性和染色体相互作用在内多组织样本的表观基因组数据。然后,该研究通过挖掘不同组学数据的信息,整合和开发了多种数据查询、浏览、分析和可视化工具,最终构建出大豆多组学数据库SoyMD。SoyMD共提供了8个组学模块以方便用户浏览和分析多组学数据,包括基因组、转录组、表观基因组、表型组、变异组、工具、下载和帮助模块。
SoyMD概述与基本框架
在SoyMD中,用户可以通过基因名称或基因索引快速获取感兴趣基因的位置、结构、功能域、代谢通路、同源基因、共线性基因及相关多组学数据等各种信息。并且,SoyMD的主页提供了一个全面的多组学搜索工具,实现了多组学信息的“一键查询”。在转录组和表观遗传学数据方面,SoyMD不仅提供了丰富的多组织基因表达和表观信号数据的浏览和图表查询,还提供了eFP浏览器以方便用户可视化地浏览基因在不同组织和发育阶段的基因表达和表观信号数据。对于群体遗传学数据,SoyMD整合了先前发布的4kSoyGVP数据集中的样本信息和遗传变异数据外,并且提供了3种基因组选择信号的浏览功能。此外,为了有效地整合表观遗传学与基因组和遗传变异数据,研究者利用卷积神经网络训练出预测表观遗传信号的模型并利用该模型预测了不同遗传变异对表观信号的影响,这些结果也整合到平台的变异模块中。最后,SoyMD在工具模块中提供了多种多组学在线分析工具,这些工具支持目前已发布的多个基因组版本的基因ID,可以帮助用户在不同的基因组中挖掘、分析重要的遗传位点和候选基因。
SoyMD 全局搜索页面
综上所述,SoyMD的开发为大豆遗传育种研究提供了重要的数据资源和分析平台。通过整合多组学数据和提供强大的分析工具,SoyMD旨在提升大豆多组学数据的价值挖掘,促进大豆遗传育种研究。
广州大学生命科学学院方超副教授和华中农业大学信息学院杨庆勇教授为论文共同通讯作者。广州大学博士后杨植全、博士生裴欣欣与华中农业大学博士生罗诚方为论文并列第一作者,广州大学生命科学学院孔凡江教授和刘宝辉教授对该项目提供了重要指导。该研究得到了国家自然科学基金、国家重点研发计划、省部共建绵羊遗传改良与健康养殖国家重点实验室重大项目、中国博士后基金等项目的资助。
论文链接:
https://doi.org/10.1093/nar/gkad786
数据库链接:
https://yanglab.hzau.edu.cn/SoyMD/#/
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.