说到三代测序,大家都不陌生,但是三代宏基因组的发展历程、核心应用场景、最新软件、数据库、生物信息学分析流程以及未来的研究方向您了解吗?
今天给大家分享一篇发表在《Genomics, Proteomics & Bioinformatics》的综述,全面梳理了三代宏基因组学的相关知识。
一、长读长宏基因组学的发展历史
三代宏基因组学的发展分为三个阶段:
起源阶段(1991–2010):
宏基因组概念提出,短读长测序技术初步应用
发展阶段(2011–2018):
PacBio RS和ONT MinION平台问世,首次应用于环境样本和病原体检测,但早期错误率较高
成熟阶段(2019–2025+):
测序精度显著提升(如PacBio HiFi Q30、ONT Q20+化学试剂),配套分析工具(如metaFlye、HiFiasm-meta)和标准化流程(如EasyNanoMeta)逐步完善
图1 三代宏基因组学的起源与关键发展
二、三代宏基因组学解析微生物群落结构和功能
1、快速鉴定群落结构:长读长测序可以检测到稀有或低丰度物种,从而更全面地揭示样本中的微生物多样性。
2、组装高质量基因组:在解决重复区域和结构变异方面表现出色,组装出更多高质量MAGs
3、预测基因与可移动遗传元件:可以获得完整的生物合成基因簇(BGC)序列,覆盖并表征多个移动遗传元件和基因水平转移事件。
4、微生物变异与种群遗传:识别短读长技术难以检测的结构变异(插入、缺失、倒位和易位),量化宏基因组中的种群异质性。
5、表观遗传与关联分析:DNA甲基化分析。提供质粒、宿主和病毒之间的关联信息。
图2 应用长读长测序解析微生物群落结构与功能
三、软件、数据库及下游分析工具
该综述详细整理了三代宏基因组分析的全套工具,从数据预处理到最终可视化,每个环节都有推荐方案。
数据质量控制:Dorado(ONT)和SMRTlink(PacBio)作为官方工具提供可靠的基序识别和数据处理;
组装工具选择:metaFlye适用于ONT数据,HiFiasm-meta则专为PacBio HiFi数据优化,两者都支持复杂微生物群落的组装;
分类与分箱:Metamaps和BASALT在长读长数据上表现出色,能够实现菌株水平的分辨率。
此外,研究团队还梳理了三代宏基因组功能注释数据库及下游数据分析、统计可视化常用的软件,详见原文表1。
图3 三代宏基因组分析的生物信息流程
四、未来展望
PacBio的通量预计将大幅提升,而ONT的精度目标直指Q30,错误率更低,从而提高宏基因组组装的可信度。随着人工智能和机器学习算法的引入,长读长数据分析将变得更加精准和高效。
凌恩生物依托牛津纳米孔(ONT)和华大(Cyclone)两大核心测序平台,凭借其稳定高效的特性,确保项目周期,为您提供更优质、可靠的科研服务。
参考文献
Computational Tools and Resources for Long-read Metagenomic Sequencing Using Nanopore and PacBio.Genomics, Proteomics & Bioinformatics, 2025.
原文链接
Doi.org/10.1093/gpbjnl/qzaf075