近日,西交利物浦大学理学院生物科学与生物信息学系魏震博士团队,联合利物浦大学研究者,在国际权威期刊《核酸研究》(Nucleic Acids Research)上发表最新成果,推出了整合多种m6A检测技术并通过交叉验证的数据库——m6AConquer。
在生命科学研究中,“RNA修饰”就像基因表达的“隐形开关”,控制着细胞何时、以何种方式制造蛋白质。其中最常见的一种叫 m6A(N6-甲基腺苷),它影响着RNA的稳定性和蛋白质合成效率,被认为与细胞功能乃至疾病发生密切相关。长期以来,这个领域一直存在一个“烦恼”:不同实验室得到的结果经常对不上。同一个基因、同一个核苷酸位点,在一篇论文里被标成“有修饰”,在另一篇论文里却显示“没有”。这种结果前后不一致的情况,让科研人员很难判断究竟哪些修饰是真实的、能重复验证的。
魏震说:“过去研究者各说各话,现在终于有了一个能‘对齐’所有数据的共同坐标系。”
研究团队借鉴了国际著名的ENCODE人类基因组计划的统计框架,采用 IDR模型来衡量不同检测方法之间的结果一致性。最终,他们识别出了超过13.5万个高置信度的m6A修饰位点(IDR < 0.05),这些位点在不同的正交实验技术之间表现出统计显著的可重复性。
魏震表示:“这项分析首次在该领域中建立了严谨的真实标准(ground truth)数据集,让不同m6A 检测方法的性能评估成为可能。科研人员可以直接利用这些经过多平台验证的修饰位点作为统一参考,不再需要为技术差异反复调整。这样不仅提高了研究的一致性和可重复性,也为后续算法开发与疾病机理研究提供了可靠的参照系。”
除了确保数据的可靠性,魏博士团队还关注“可用性”——如何让这些数据更容易被科学家使用。
m6AConquer建立了一个标准化的数据共享框架,把原本分散、复杂的多组学原始数据重新整理为“分析就绪”的矩阵化格式。这就像把散落在不同国家的字典整合成同一种语言版本,研究人员无需再花大量时间清洗、对齐数据,就能直接开展比较、建模和验证,大幅提升科研效率与可复现性。
魏震表示:“这意味着我们不仅能看到RNA修饰的‘结果’,还开始理解它背后的‘原因’。有些基因突变可能正是通过影响RNA修饰水平,间接改变了疾病风险……我们希望这一开放资源能够成为推动表观转录组学从‘数据整合’走向‘机制理解’的重要一步。”
目前,m6AConquer数据库和所有分析工具已在网站 rnamd.org/m6aconquer免费向全球科研人员开放。(中国教育新闻网通讯员 王璐谣寇博)
作者:王璐谣 寇博