news 2026/2/7 10:26:57

如何进行群体遗传结构分析?

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
如何进行群体遗传结构分析?

群体遗传结构,作为群体遗传学的核心研究目标与关键产出,旨在揭示遗传变异在群体中的时空分布格局。在众多相关研究中,由系统发育树、主成分分析与ADMIXTURE等经典方法共同构成的整合分析图谱,已成为解码这一格局的“标准密码”(图1)。今天,我们将共同学习如何从重测序数据出发,一步步完成这份核心图谱的构建。

图1 群体遗传结构示例

图a系统发育树,观察各枝分布来判断群体的聚类情况。图b主成分分析,不同的颜色代表了不同的群体,观察不同颜色样本在坐标图中的位置来判断群体演化特征。图c交叉验证误差统计图,折线图最低点对应的X轴为最佳分群数。图d群体分层分析,不同颜色代表不同假设祖先群体,观察k为最佳分群数时的祖先来源构成,来推断样本的混杂或分化历史。

01 系统发育树

首先,我们通过系统发育分析来解析样本间的聚类情况。整个流程从遗传距离计算开始:我们使用VCF2Dis软件(https://github.com/BGI-shenzhen/VCF2Dis),它能基于包含样本数据的VCF文件,计算出标准化的群体间遗传距离矩阵(图2)。获得遗传距离矩阵后,可将其上传至在线工具FastME 2.0(http://www.atgc-montpellier.fr/fastme/),选择“Distance matrix”格式并设置相应参数,提交任务后即可通过邮件获取系统发育树文件(.nwk格式)。最后,将该文件导入iTOL在线平台(https://itol.embl.de/upload.cgi),即可对系统发育树进行查看、编辑与美化,从而直观展示群体间的遗传结构与聚类情况。

图2 VCF2Dis软件使用

02.主成分分析

虽然我们通过系统发育分析可以知道群体中的分群情况,但是系统发育分析却不能反映个体在宏观遗传空间中的位置。这个时候我们就需要利用主成分分析找出能最大程度解释遗传变异的前几个主成分,并将每个样本投射到这个由PC构成的二维/三维“地图”上。通过主成分分析可以知道群体主要的分化方向,是连续渐变还是离散聚类以及找群体中的离散个体(图3)。这个过程我们使用Plink计算主成分,使用R语言(https://posit.co/download/rstudio-desktop/)进行可视化绘图。

图3 主成分计算

图4 R语言绘图

03.群体分层分析

通过主成分分析与系统发育分析,我们已初步揭示了样本间的聚类关系与遗传分化格局。然而,这些方法尚不能回答一个更为本质的问题:这些个体究竟源自多少个潜在的祖先群体?为了追溯群体的混合历史并量化个体的祖先来源构成,我们需要借助群体分层分析。以ADMIXTURE为代表的方法,能够推断每个个体基因组中来源于K个假设祖先群体的比例,并通过交叉验证确定最优的K值。该分析对于发现隐蔽的遗传亚群、识别混合或异常个体具有关键作用。

图5 群体遗传分层分析

图6 admixture的结果文件

通过对系统发育、主成分与群体分层分析的综合解析,我们已对群体的遗传结构有了基本的认知。然而,这些初步结果尚未充分揭示群体内各组分之间的遗传差异程度、分化水平及其内在联系。因此,为深入理解群体结构与演化动态,后续有必要开展更为精细的遗传分析,如:群体遗传分化指数分析,遗传多样性分析以及基因流分析等等。这些分析将帮助我们更完整地刻画群体的遗传格局与演化历程。后续内容我们下次再一起学习。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/4 18:08:55

每周读书与学习-amp;gt;JMeter性能测试脚本编写实战(三)如何利用JMeter为MySQL数据库构造测试数据

每周读书与学习是由清华大学出版社出版的《JMeter核心技术、性能测试与性能分析》一书的作者推出,分享作者多年的IT从业经历,希望对很多计算机科学技术IT类专业毕业生以及IT从业者有所帮助。 在前面的学习中,介绍了很多Jmeter的理论知识&…

作者头像 李华
网站建设 2026/2/3 11:20:42

存储空间规划:合理管理海量输出视频

存储空间规划:合理管理海量输出视频 引言:从生成到存储的工程挑战 随着 AIGC 技术的快速发展,Image-to-Video 图像转视频生成器已成为内容创作领域的重要工具。由科哥主导二次开发的这一版本,基于 I2VGen-XL 模型构建,…

作者头像 李华
网站建设 2026/2/3 14:46:35

3D GS编辑

GitHub - sparkjsdev/spark: :sparkles: An advanced 3D Gaussian Splatting renderer for THREE.js

作者头像 李华
网站建设 2026/2/5 2:05:36

大场景3DGS

Horizon-GS: Unified 3D Gaussian Splatting for Large-Scale Aerial-to-Ground Scenes GitHub - InternRobotics/HorizonGS: [CVPR 2025] Horizon-GS: Unified 3D Gaussian Splatting for Large-Scale Aerial-to-Ground Scenes

作者头像 李华
网站建设 2026/1/29 22:49:57

Sambert-HifiGan性能测评:中文情感语音合成的速度与质量

Sambert-HifiGan性能测评:中文情感语音合成的速度与质量 引言:为何需要高质量的中文多情感语音合成? 随着智能客服、虚拟主播、有声读物等应用场景的快速发展,传统“机械式”语音合成已无法满足用户对自然度和表现力的需求。尤其是…

作者头像 李华
网站建设 2026/2/6 20:02:33

Sambert-HifiGan在金融行业的应用:智能客服系统搭建

Sambert-HifiGan在金融行业的应用:智能客服系统搭建 引言:语音合成如何重塑金融服务体验 在数字化转型浪潮下,金融行业对智能化服务的需求日益增长。传统客服系统依赖人工坐席或机械式TTS(文本转语音)播报,…

作者头像 李华