【基于R语言群体遗传学】-13-群体差异量化-Fst
在前几篇博客中,我们深度学习讨论了适应性进化的问题,从本篇博客开始,我们关注群体差异的问题,建议大家可以先看之前的博客:群体遗传学_tRNA做科研的博客-CSDN博客
一些新名词
Meta-population:An interconnected group of smaller populations.
亚种群:一个由较小的种群相互连接组成的群体。
Deme:Asingle population within a meta-population.
局域种群:亚种群内的单个种群。
Sub-population:A group of individuals within a population that are more likely to breed with each other than members of other sub-populations.
子种群:种群中的一组个体,它们彼此之间比其他子种群的成员更有可能进行繁殖。
分化的量化(quantifying divergence)-Fst
群体遗传学的一个共同关注点是量化可识别种群之间的差异。衡量种群间差异的一个关键指标是FST,它已经被反复定义和重新定义。FST是由Sewall Wright推导出的F统计量之一(更多信息请参见Weir 2012),广义上是对两个相关种群之间遗传差异的量化,通常在从零(无差异)到一(完全差异)的范围内变化。
从概念上讲,FST可以被理解为一种度量,它告诉我们相对于整个种群的总多样性,不同亚种群之间缺失了多少多样性。换句话说,如果FST的值接近1,这意味着亚种群之间的遗传差异很大,每个亚种群可能具有独特的遗传特征;而如果FST的值接近0,则意味着亚种群之间的遗传差异很小,它们在遗传上是相似的。
FST的计算通常涉及到比较种群内的遗传变异与种群间的遗传变异。一个高的FST值表明种群间的遗传变异占总体遗传变异的比例较高,即种群间的差异较大;而一个低的FST值则表明种群内的遗传变异占主导,种群间的差异较小。
根据哈代-温伯格定律,我们知道当有等位基因频率时,我们可以预期的多样性(即杂合子)的数量是2p(1-p)。如果我们有多个亚种群的等位基因频率测量,我们可以说我们总的预期杂合性(HT)是:
其中p是所有亚种群的平均等位基因频率。我们可以将这个值与我们在每个亚种群内观察到的杂合性水平(HS)的平均值进行对比,如果我们有两个亚种群,那么HS将是 :
其中p1是亚种群1中的等位基因频率,p2是亚种群2中的等位基因频率,H1和H2是每个亚种群内杂合性的相应度量。
我们可以可视化Hs与Ht:
# 定义两个群体的等位基因频率 p1