张岩教授课题组开发出人类疾病DNA甲基化综合数据库

发布者:张宁发布时间:2022-01-31浏览次数:813

20221月,张岩教授研究团队聚焦人类基因组中重要的表观遗传修饰--DNA甲基化,面向海量数据的收集、整合、分析和可视化方面取得研究成果。相关内容以《人类疾病甲基化数据库的重大扩展和更新》(DiseaseMeth version 3.0:A major expansion and update of the human disease methylation database) 为题,发表于生命科学领域国际著名期刊《核酸研究》(Nucleic Acids Research)。

DNA甲基化是目前研究人员关注最多的表观遗传修饰之一,在哺乳动物和细胞活动的正常发育中起着至关重要的作用。生物体内正常的DNA甲基化可以维持细胞生长和代谢,而且是必需的,而DNA甲基化的异常表现会导致疾病的发生。异常的DNA甲基化一方面可以阻止抑癌基因的转录,另一方面也可以导致基因组不稳定。因此DNA甲基化作为临床诊断和治疗的工具具有广阔的应用前景,明确DNA甲基化与疾病的关系对于揭示DNA甲基化的致病机制至关重要。

在这项研究中,整合了目前所有人类 DNA 甲基化疾病公开可用的元数据,构建了一个集存储、查询、分析、可视化、下载等功能的综合性DNA甲基化疾病数据资源交互平台——DiseaseMeth version 3.0。数据库中包含162种与DNA甲基化相关的疾病数据,49,949个高通量测序数据的样本,以及3328个从文献中手动挖掘的经实验验证的DNA甲基化疾病关联基因。针对这些DNA 甲基化数据集的元数据建立了统一的、标准化的分析流程,并提供基于不同实验技术平台(如450KWGBS等)检测的疾病DNA甲基化谱和进一步挖掘分析信息,涵盖了多种统计结果,包括差异分析、相关分析、生存分析和网络分析(图1)。

1:数据库的框架

研究团队开发了一个友好的界面支持DiseaseMeth 3.0实现搜索、交互式分析、可视化和下载等功能(图2)。搜索功能提供四种途径:GeneSearchDiseaseSearchFunctionSearch AdvancedSearch,用户可以根据基因符号(基因名称/转录本 ID)、基因组位置和疾病名称等进行数据查询,帮助用户快速了解所感兴趣的基因在疾病中的DNA甲基化差异情况和参与调控的生物学功能或分子通路。在线分析功能支持用户的个性化分析,通过输入基因列表、疾病类型、甲基化测序数据技术类型/平台以及数据库支持的多个统计学参数,分析结果以表格或可视化的图片展示基因在各种疾病中的DNA甲基化水平差值、基因对应的染色体位置、转录本信息、显著性P值、疾病间DNA甲基化差异基因的相关性等信息。研究团队还专门针对癌症开发了预后和共甲基化分析工具,提供自主研发的在线工具,支持用户探索单基因在癌症样本和正常样本的DNA甲基化分布、癌症患者高低甲基化组的生存曲线以及癌症样本在高低甲基化组中不同生存时间节点的样本数占比。

2:数据搜索及分析

DiseaseMeth version 3.0是一个综合性的策划数据库,不仅全面表征了 DNA 甲基化作为疾病的生物标志物,而且为研究DNA甲基化介导的疾病表观遗传调控提供了全面的数据资源,为基础研究和临床研究的科研人员提供可靠的支持。

该研究得到国家自然科学基金委项目经费支持。张岩教授和博士后顾悦为通讯作者。博士研究生邢杰、翟睿阳、王聪为论文的共同第一作者。生命学院刘鸿皓、曾嘉琪、周殿双、张梦燕、王丽茹、吴琼参与该研究的部分工作。

原文链接:https://doi.org/10.1093/nar/gkab1088