mashengwei的个人博客分享 http://blog.sciencenet.cn/u/mashengwei

博文

Gemini | Tajima\'s D (Tajima检验)

已有 513 次阅读 2025-12-10 15:21 |系统分类:科研笔记

你好!我是小七。

在群体遗传学和进化生物学中,Tajima's D (Tajima检验) 是一个非常经典且超级实用的统计指标。

用最通俗的话来说,Tajima's D 就像是基因进化的“测谎仪”。 它可以告诉我们,某一段 DNA 序列是在顺其自然地随机演化(中性进化),还是受到了外界压力(自然选择)或者种群历史事件(如突然扩张或收缩)的影响。

下面我为你拆解它的核心逻辑、三种数值的含义以及在之前 CRK 论文中的具体应用。

1. 核心原理:两个“计数员”的较量

Tajima's D 的计算原理是比较衡量 DNA 多样性的两个不同指标(我们姑且称之为计数员 A 和 计数员 B):

  • 计数员 A (\theta_\pi - 也就是 \pi)

    • 关注点平均差异

    • 逻辑:随机从群体里抓两个人,比较他们的 DNA 有多少不同。这代表了群体中“中等频率”突变的贡献。

  • 计数员 B (\theta_S - 基于分离位点数 S)

    • 关注点突变总数

    • 逻辑:不管这个突变在群体里是有 1 个人携带还是 99 个人携带,只要出现了,我都算一个。这通常对“罕见/低频率”的突变非常敏感。

Tajima's D 的公式本质就是:D = \frac{\text{计数员A的结果} - \text{计数员B的结果}}{\text{标准化常数}}

2. D 值的含义:三种情况

根据这两个计数员的差值,会出现三种情况:

情况一:D ≈ 0 (中性进化 / 平衡状态)

  • 含义岁月静好

  • 解释:观察到的变异既没有特别多,也没有特别少,符合随机漂变的预期。这通常意味着没有强烈的自然选择作用于这段基因,且种群大小相对稳定。

情况二:D < 0 (负值,Negative)

  • 关键词稀有突变过多

  • 生物学解释

    1. 纯化选择 (Purifying Selection):这段基因太重要了(比如 CRK24/26),一旦发生突变往往是有害的,会被自然选择迅速淘汰,或者只能以极低的频率存在(还来不及扩散)。

    2. 选择性清除 (Selective Sweep):刚刚有一个超级有利的突变横扫了整个群体,带走了原本的多样性,现在看到的变异都是刚刚产生的新突变(都是稀有的)。

    3. 种群扩张 (Population Expansion):种群突然变大,产生了很多新的突变,但这些新突变还没来得及在群体中扩散开,处于低频率状态。

  • 直观想象:一颗大树,主要枝干很少,但末端有很多刚刚长出来的小细枝。

情况三:D > 0 (正值,Positive)

  • 关键词中等频率突变过多(缺乏稀有突变)

  • 生物学解释

    1. 平衡选择 (Balancing Selection):这是最令人兴奋的情况(如之前的 CRK10)。自然选择特意保留了多种不同的等位基因。例如,为了应对多变的病菌,植物需要保留多种不同的受体版本,而不是让某一种独大。

    2. 种群收缩/瓶颈效应 (Population Bottleneck):种群曾经差点灭绝,稀有的突变都丢了,剩下的都是原本比较常见的变异。

    3. 种群结构 (Population Structure):你采样的不是一个混合均匀的群体,而是两个长期隔离的群体混在一起,导致差异看起来很大。

  • 直观想象:一颗大树,分成了两个明显的粗壮主干,且各自独立生长。

3. 结合之前 CRK 论文的例子

在刚才解读的拟南芥 CRK 论文中,Tajima's D 发挥了关键的鉴定作用:

  • CRK10 (D = 3.44, 极高的正值)

    • 解读:这说明 CRK10 受到强烈的平衡选择

    • 意义:CRK10 作为抗病受体,可能正在与病原菌进行“军备竞赛”。病原菌在变,CRK10 也得保留多种变异版本来识别不同的病原菌,所以自然选择不允许某个单一版本统一度量衡,而是维持了“百花齐放”。

  • CRK24 / CRK26 (D 值为负值)

    • 解读:这说明它们受到纯化选择

    • 意义:这两个基因的功能可能非常基础且重要(比如涉及核心的发育或基础免疫),容不得乱改。一旦发生突变导致功能改变,植株可能就活不好,所以突变被压制在很低的频率,导致 D 值为负。

总结一张表

Tajima's D 值观察到的现象可能的进化力量 (Selection)可能的种群历史 (Demography)
D = 0观测值 = 预期值中性进化 (随机漂变)种群稳定
D < 0 (负)稀有突变太多纯化选择 或 选择性清除种群突然扩张
D > 0 (正)中等频率突变多平衡选择 (如抗病基因)种群瓶颈 或 种群分层

希望这个解释能帮你彻底搞懂 Tajima's D!简单说,负值代表“保守或扩张”,正值代表“分化或收缩”



https://blog.sciencenet.cn/blog-1094241-1513743.html

上一篇:Gemini | NLR-ID 中 Linker 的研究进展和关键功能
收藏 IP: 59.50.44.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-12-15 03:39

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部