chinesehugh的个人博客分享 http://blog.sciencenet.cn/u/chinesehugh

博文

[转载]核酸分子进化的标记——Ka/ks

已有 5236 次阅读 2023-3-13 18:50 |系统分类:科研笔记|文章来源:转载

Ka/Ks分析是生物信息学常见分析之一,它在研究核酸分子进化方面有重要应用。计算Ka/Ks的意义在于理解蛋白编码序列的亲缘关系,重建系统发育,分析选择压力是基因家族分析中十分重要的一部分

什么是Ka/Ks

在遗传学中,Ka/Ks表示的是两个蛋白编码基因的非同义替换率Nonsynonymous substitution rateKa)和同义替换率Synonymous substitution rateKs)之间的比值。通过这个指标可以判断是否有选择压力作用于这个蛋白质编码基因。

举例来说,如果手头有两个不同物种的同一个基因的序列,比如人和小鼠的p53基因,将这两个基因的序列进行比对,你会发现这两段序列有差异(进化!)。再仔细观察,你会发现有些碱基的变化导致了编码氨基酸的变化(非同义替换),有些没有导致编码氨基酸的变化(同义替换)。这是由密码子的简并性造成的,因为3个碱基决定1个氨基酸,而64种碱基组合决定20种氨基酸,所以会有冗余出现。一般情况下,第三个碱基变化会造成同义替换,而第一、第二个碱基的变化会造成非同义替换。

图1 密码子.jpg

KaKs的计算公式:

Ka = 非同义替换SNP/非同义替换位点数, 即非同义替换

Ks = 同义替换SNP/同义替换位点数, 即同义替换

其中,非同义替换位点数就是会造成氨基酸变化的位点数的总和,比如编码丝氨酸(Ser)的第一二位碱基。而同义替换位点数就是不会造成氨基酸变化的位点数的总和,比如编码丝氨酸的第三位碱基。对于像第一个方框里面的苯丙氨酸(Phe)和亮氨酸(Leu)这种情况,第三位碱基的变化有50%的可能造成氨基酸的变化,则在计算非同义替换位点数和同义替换位点数时,各计为0.5,相当于平分这一位点。另外,计算Ka/Ks时,不考虑start codonstop codon

好了,现在回到上面的人和小鼠的p53基因的例子。我们只需要数一下两个序列发生(非)同义替换的SNP数,再除以总的可替换位点数,就得到了KaKs值,继而得到两者的比值。

原理似乎很简单,然而,实际计算并不简单。

上面的计算方法没有考虑不同碱基之间替换速率的不同。比如,嘌呤之间替换的概率(AG)要高于嘌呤替换为嘧啶的概率(AC/T),也就是说转换(transition,嘌呤变嘌呤,嘧啶变嘧啶)发生的概率要高于颠换(transversion,嘌呤变嘧啶,嘧啶变嘌呤)发生的概率。很多计算方法都会考虑到这些替换发生概率的不同。

另外,如果两个物种的分化时间较长,情况更为复杂,可能会影响Ka/Ks的比值。比如有一个位点,原来是A,后来变成T,再后来又变成C,虽然发生了两次替换,但仅有一次被用于计算替换率。再比如有一个位点,原来是A,后来变成T,但同时与它相对应的另一个序列的位点,也发生了AT的替换,那么我们也无法用上面的方法来计算替换率。对于这些复杂情况,我们可以用最大似然法来计算替换率,这里不再详述。

Ka/Ks和进化有什么关系?

如果一个基因没有受到自然选择压力,那么根据中性选择理论,非同义替换率和同义替换率应该是相同的。一般来讲,因为非同义替换会造成氨基酸变化,可能会改变蛋白质的构象和功能,因此会造成适应性的变化,从而带来自然选择的优势或劣势(一般是劣势)。而同义替换没有改变蛋白质的组成,因此不受自然选择的影响(这里我们忽略密码子偏好性的影响)。总之,ks能够反映进化过程的背景碱基替换率,而Ka/Ks的比值能够说明这个基因受到了何种选择。

图2 长颈鹿.png

长颈鹿的长脖子基因肯定是受到了正选择……

一般情况下,在某个体中偶然发生的一个碱基替换(突变),如果没有额外的好处或者坏处的话,慢慢地也就消失了。但是在自然选择中会有很多巧合,某些突变就很幸运地被保留了下来,并且被固定了(突变频率由极小变为100%)。一个这样的突变在二倍体种群中被固定的可能性为1/2N,其中N是种群大小。在这种情况下,非同义突变被固定下来的可能性与同义突变的可能性相同。也就是说,在没有受到自然选择压力的情况下,基因的Ka/Ks比值接近1

图3.png

小鼠和大鼠的835个直系同源基因的Ka/Ks比值的频率分布

但实际上,这个比值远小于1,因为一般非同义替换带来的都是有害的性状,不能被固定下来。但好消息是,某些具有特殊功能的基因处于强烈的选择压力之下,例如某些与病原共同进化的免疫基因,它们的某些结构域的Ka/Ks比值很可能远大于1,这就给我们提供了一种启示。

于是,我们有了下面的分类:

Ka/Ks1,基因受到正选择(positive selection

Ka/Ks=1,基因中性进化(neutral evolution

Ka/Ks1,基因受到纯化选择(purify selection

Ka/Ks比值能做啥?

人和黑猩猩的基因组只有约1.09%差异,染色体的数目及形态几乎没有变化,但是仔细去看的话,会发现很多染色体片段的重排,也就是重新洗牌。2003年发表在Science的一篇研究发现,发生重排部位的基因,受到正选择(Ka/Ks1)的比例要显著高于没有发生重排部位的基因,这说明染色体重排与基因功能的分化密切相关,也与人和黑猩猩的分化密切相关。

图4.png

人和黑猩猩染色体非重排部位(Colinear)和重排部位(Rearranged)基因的Ka/Ks分布。红色线条为Ka/Ks=1的分界线。重排部位基因受到正选择的比例更高。

Ka/Ks1时,基因受到强烈正选择,这样的基因即为近期正在快速进化的基因,对于物种的进化有着非常重要的意义。我们可以根据Ka/Ks比值筛选部分基因,然后做后期的功能研究,这种方法已经被普遍应用到分子进化研究领域

除了查找快速进化基因,Ka/Ks还能用于检测基因的功能性,因为假基因(pseudogene)的Ka/Ks比值通常比功能基因更高(大家想想为什么?)。此外,Ks代表进化过程的背景碱基替换率,可用来反推事件发生的时间,如全基因组多倍化的时间,这在探究物种起源方面有重要应用。

相关文献:

Hurst L. D. (2002). The Ka/Ks ratio: diagnosing the form of sequence evolution. Trends in genetics, 18(9), 486.

Navarro, A., & Barton, N. H. (2003). Chromosomal speciation and molecular divergence -- accelerated evolution in rearranged chromosomes. Science, 300(5617), 321324.

北大教授顾红雅老师的公开课:生物演化http://www.chinesemooc.org/live/611219

参考:

1. 搜狐https://www.sohu.com/a/204503028_761120

2. 知乎https://zhuanlan.zhihu.com/p/105910386?ivk_sa=1024320u

3. 360个人图书馆http://www.360doc.com/content/19/1112/07/19913717_872553965.shtml




https://blog.sciencenet.cn/blog-3431904-1380233.html

上一篇:[转载]动植物性状基因定位方法——BSA全基因组重测序
下一篇:[转载]为人民做的梦,终会实现(略记国之脊梁袁隆平)
收藏 IP: 112.36.92.*| 热度|

1 李升伟

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

IP: 120.229.84.*   闁搞儳鍋涢ˇ锟� | 閻犙嶆嫹 閻犙嶆嫹 +1 [30]xtn   2024-11-19 14:26
闁挎稑鐗呯紞鏃€绋夋潪鎵伇濞达絽绉舵晶鍧楁偠閸℃鍔呴悗纭咁啇缁辨繈骞嬮幋鐐电畳闁活厹鍎抽~鏍偓娑抽檮鐢壆妲愰姀銏$暠濞戞挸绉靛Σ妤呭椽鐏炵瓔鍤犲☉鎿冧簷濮瑰宕f繝鍌ゅ晙閹兼惌鍘惧▓鎴c亹閸楃偞鎯欓柕鍡楀€荤紞蹇涘极濞嗘劕鎴块柣銊ュ濞笺儵骞愭担鍛婂闁绘埈鍘介崕蹇涘及椤栨稑鐏夊ù鐙€鍓氭晶宥夊嫉婢跺鐪介柣銊ュ椤線寮介崙銈囩濞寸姵鐗滃▓鎴犳嫻閿涘嫬鐩€閻忓繐妫旂槐鎵偖椤愶附鎳冮悹浣藉焽閳ь剙鍋婄槐锟�
IP: 110.152.171.*   闁搞儳鍋涢ˇ锟� | 閻犙嶆嫹 閻犙嶆嫹 +1 [29]鐎殿喚濮撮鐔煎棘閿燂拷   2024-3-3 21:00
闁诡兘鍋撻煫鍥╊暜缁憋拷
鐎殿喚濮撮鐔煎棘閸ワ妇鑹�2024 03 03
IP: 112.44.105.*   闁搞儳鍋涢ˇ锟� | 閻犙嶆嫹 閻犙嶆嫹 +1 [28]闁绘粌顑夌粻锟�   2021-4-20 10:45
闁告碍鍨圭紞蹇涘极濞嗘劕鎴块柤宄扮摠閺嗘岸鏁嶇仦鑲╊伇濞达絽绉跺﹢鈥愁潰閿濆洦鐣遍悗娑崇畳閳ь剨鎷�
IP: 125.114.80.*   闁搞儳鍋涢ˇ锟� | 閻犙嶆嫹 閻犙嶆嫹 +1 [27]濡炶鍓熷ḿ姘剁嵁閿燂拷   2019-12-19 10:36
缂傚啯顨夐埀顑跨缁椻偓闁哄嫷鍨辩敮鎵閵忋垺鍩傞柣鐐叉娴滃墽鎹勯娆戠憪闁活亞鍠愰婊堟儍閸曨偄顎栧璇″亖閳ь剙鍊圭换渚€宕氶崶銊㈠亾閳ь剝绠涢悽鐢电▌闁奸绀佺粭鈧柕鍡嫹
IP: 122.225.220.*   闁搞儳鍋涢ˇ锟� | 閻犙嶆嫹 閻犙嶆嫹 +1 [26]閻犙呮暩缁躲劍绻涢敓锟�   2019-12-17 10:20
闁煎搫鍊搁幖銉╂晬瀹€鈧紞蹇涙嚀娴e摜鐟庡☉鎾亾閻犱警鍨甸摂瀣附婵劏鍋撻崒妯峰亾閸屾ǚ鍋撻敓锟�
IP: 113.115.64.*   闁搞儳鍋涢ˇ锟� | 閻犙嶆嫹 閻犙嶆嫹 +1 [25]鐎电増鍔栧锟�   2019-12-16 18:33
闁奸绀佸鍝ユ導閺夎¥鍋�
IP: 14.221.237.*   闁搞儳鍋涢ˇ锟� | 閻犙嶆嫹 閻犙嶆嫹 +1 [24]闁告帗蓱绾撅拷   2019-12-16 09:49
闁活亜顑呴崺灞绢渶閸曨喒鍋撴担鍝ョ憥闁汇劌瀚畷銉╁棘閸ヮ亞绠峰☉鎾崇У閺嗗秹鎯勯梹鎰箚缂傚啯顨夐埀顑跨缁椻偓閻忕偛鎳愰崝褏鎸ф0浣哄晩 闁炽儻鑵归埀顒婄畵缁秹鎳撴担鍝ョ憥闁告粌鐬奸崢鐟拔涚€n亞姣堥柡鍫濐儏瀵悂鎳為崒姘儉濞e洦绻堥崳鎼佸Υ閿燂拷
IP: 60.255.229.*   闁搞儳鍋涢ˇ锟� | 閻犙嶆嫹 閻犙嶆嫹 +1 [23]缂傚啯顨嗛弳鈧柡鍕舵嫹   2019-11-12 20:04
閻犲鍨奸梼鎸庡緞瑜嶉宥夋儍閸曨偄褰犻煫鍥у暔閳ь剙鍊哥缓楣冩煂鐏炵偓锟ラ梻鍕姈閸斿懎鈹戦埀顒勫Υ閿燂拷
IP: 202.103.215.*   闁搞儳鍋涢ˇ锟� | 閻犙嶆嫹 閻犙嶆嫹 +1 [22]闁哄閰i。缁樼▔閿燂拷   2019-11-8 17:03
  
IP: 120.196.145.*   闁搞儳鍋涢ˇ锟� | 閻犙嶆嫹 閻犙嶆嫹 +1 [21]闁告婢橀妵鍥ㄧ▔閿燂拷   2019-11-7 17:19
闁煎搫鍊搁幖銉︺亜閸濆嫬缍侀柨娑楁祰椤曨剟姊婚鑺バ﹂煫鍥у暢閸撳磭鎮伴埀顒傜不閿涘嫭鐣遍柣銈呭⒔濮婄偓娼诲Ο缁樞﹂柤鑼舵硶濡差偊鏁嶉敓锟�
闁搞儳鍋涢ˇ锟�  闁挎冻鎷� 闁艰尪娉曞Σ锟�
2019-11-12 20:001 婵°倗銆嬬槐娆撳炊閻愬樊妲绘俊銈夋?鐎靛矂鏁嶉敓锟� 閻犙嶆嫹 閻犙嶆嫹 +1 | 闁搞儳鍋涢ˇ锟�
IP: 202.113.11.*   闁搞儳鍋涢ˇ锟� | 閻犙嶆嫹 閻犙嶆嫹 +1 [20]闁哄鍔嶉婊堟偤閿燂拷   2019-11-7 14:14
闁搞儲绋戠粣娑欏緞瑜嶉鐔虹磾濡や焦娈岄柡鍕閺嗏偓闁瑰搫鐗忛崣搴ㄦ偋閸ラ绀勯柟鍏肩矒濞夛箓鏁嶉敓锟�
http://blog.sciencenet.cn/blog-107667-1205142.html
IP: 202.113.11.*   闁搞儳鍋涢ˇ锟� | 閻犙嶆嫹 1 +1 [19]闁哄鍔嶉婊堟偤閿燂拷   2019-11-6 19:42
婵炲苯顦卞Λ婵嬪箖閻撳骸鎮嶉柛銉︾☉缁愭稒寰勮椤掔喓绱斿Δ浣规畬闁哄嫬瀛╅弳鈧柟鍝勭墳缁憋拷
http://blog.sciencenet.cn/blog-107667-1204940.html
  
闁诡喓鍔忔俊顓㈠传閳ь剚銇勯崫鍕秮闁靛棴鎷�
IP: 120.230.114.*   闁搞儳鍋涢ˇ锟� | 閻犙嶆嫹 閻犙嶆嫹 +1 [18]濠殿喗淇虹换锟�   2019-11-6 13:02
闁告績鍋撻柟顔俱€嬬槐锟�
IP: 171.34.164.*   闁搞儳鍋涢ˇ锟� | 閻犙嶆嫹 閻犙嶆嫹 +1 [17]闁哄瀛╅惈妤冩導閿燂拷   2019-11-6 10:16
   闁煎搫鍊搁幖锟�
IP: 60.165.142.*   闁搞儳鍋涢ˇ锟� | 閻犙嶆嫹 閻犙嶆嫹 +1 [16]闁戒焦绋撶粈宀€鐥敓锟�   2019-11-6 09:32
闁煎搫鍊搁幖銉︺亜閸濆嫬缍侀柨娑楁缁绘岸鏌屽鍫濇鐎圭ǹ宕幏鎵偓娑掓櫅閻℃瑩濡撮崒婊呯▌闁奸绀佺粭鈧悗鐢殿攰缁绘牗绋夐鍐懐闁伙絽鐬煎▓鎴c亹閸楃偞鎯欓梺顔挎濠€顏呭緞瑜嶉宥夊椽鐏炶偐閾傞柣銊ュ椤掔喖鎮介悢鐑樼暠闊洤鍟撮崳鐑藉川閳ь兘鍋撻敓锟�
IP: 118.249.58.*   闁搞儳鍋涢ˇ锟� | 閻犙嶆嫹 閻犙嶆嫹 +1 [15]闂侇噮鍘奸〃姘涢敓锟�   2019-11-5 16:27
闁煎搫鍊搁幖銉︺亜閸濆嫬缍侀柨娑樼灱缂嶅繘鎳撴担鍝ョ憥閻庣懓顦版导鍛村Υ閿燂拷
IP: 117.147.41.*   闁搞儳鍋涢ˇ锟� | 閻犙嶆嫹 閻犙嶆嫹 +1 [14]闁告帗枪婢瑰洤顩奸敓锟�   2019-11-5 16:26
濠靛倽妫勯妶钘壝洪懡銈嗙祷閻忓繗椴稿Σ鍝モ偓闈涚秺閳ь剚绻嗛埀顒€鎳忓〒鑸电附閻e本鐣辩紒缁簻鎼达拷
hidden
IP: 202.113.11.*   | [13]闁烩偓鍔嶉崺娑㈠触閿燂拷   2019-11-5 16:04
閻犲洤瀚鎴濐啅閼碱剛鐥呴悶姘煎亞椤牜鈧冻濡囩紞澶愬礆閻樼粯鐝�
IP: 218.76.150.*   闁搞儳鍋涢ˇ锟� | 閻犙嶆嫹 閻犙嶆嫹 +1 [12]濡炶鍓欓惀澶嬬▕閿燂拷   2019-11-5 13:46
http://blog.sciencenet.cn/blog-361477-1204909.html
IP: 112.65.185.*   闁搞儳鍋涢ˇ锟� | 閻犙嶆嫹 閻犙嶆嫹 +1 [11]闁告帗锚閻ュ宕濋敓锟�   2019-11-5 12:43
闁告績鍋撻柟顔俱€嬬槐锟�
IP: 112.80.77.*   闁搞儳鍋涢ˇ锟� | 閻犙嶆嫹 閻犙嶆嫹 +1 [10]xqhuang   2019-11-5 12:03
闁煎搫鍊搁幖銉╂晬娴h锟ユ繛澶嬫礈濞村绌遍埥鍛闁诡兘鍋撻煫鍥涧濠€顏嗙矓閹存繍鍔呯紓鍐╁灣鐠愮喖骞戝鍛唶缂佸鍨甸鐔兼儑閻旂儤鍊為柤鏉挎湰婵绂嶆径灞剧暠闁哄啨鍎遍悺娆撴晬瀹€鈧紞蹇涘礂閸曨喛娉插┑鍌涙灮缁憋拷     
IP: 113.68.239.*   闁搞儳鍋涢ˇ锟� | 閻犙嶆嫹 閻犙嶆嫹 +1 [9]缂佸顑嗗▍锟�   2019-11-5 11:39
闁告績鍋撻柟顔俱€嬬槐锟�
IP: 117.151.127.*   闁搞儳鍋涢ˇ锟� | 閻犙嶆嫹 閻犙嶆嫹 +1 [8]闁告帗蓱濡挳妫侀敓锟�   2019-11-5 11:27
闁煎搫鍊搁幖銉╂晬娴i绠介梺鎻掔▌缁憋拷
IP: 180.201.137.*   闁搞儳鍋涢ˇ锟� | 閻犙嶆嫹 閻犙嶆嫹 +1 [7]闁告帗锚缂傛捇寮搁敓锟�   2019-11-5 11:22
闁告績鍋撻柟顕嗘嫹
IP: 117.152.90.*   闁搞儳鍋涢ˇ锟� | 閻犙嶆嫹 2 +1 [6]闁哄懎绻戦崹姘跺椽閿燂拷   2019-11-5 11:09
缂傚啯顨嗛弳鈧柡鍕閸ㄦ粓鎯冮崟顐犲仺闁哄牆顑呭鎼佹晬鐏炴儳浜堕悗鐟邦槹娴煎懘濡撮崒娑樼亯閻忓繐妫涢幋椋庣磼椤撶偟鏆氶柟瀛樺姈閸嬪秵瀵兼担鐑樼闁汇劌瀚~鏍偓娑冲閻栬櫣绮氶煬娴嬪亾閿燂拷
IP: 103.134.198.*   闁搞儳鍋涢ˇ锟� | 閻犙嶆嫹 閻犙嶆嫹 +1 [5]闂侇喗鍨跺鍫ュ礃閿燂拷   2019-11-5 10:39
闁煎搫鍊搁幖銉︺亜閸濆嫬缍侀柨娑樺缁绘岸鏌屽鍫ョ叐濞达綇鎷�
IP: 60.220.79.*   闁搞儳鍋涢ˇ锟� | 閻犙嶆嫹 閻犙嶆嫹 +1 [4]閻犙呮暩椤╂挳宕归敓锟�   2019-11-5 10:12
闁哄牊绋栨俊顓㈠传閳ь剟鏁嶇仦鎯уЫ缂傚啯顨夐埀顑跨缁椻偓閻庣懓顦版导鍛村Υ閿燂拷
IP: 222.244.139.*   闁搞儳鍋涢ˇ锟� | 閻犙嶆嫹 閻犙嶆嫹 +1 [3]闁告帗锚閸欏繘骞堥敓锟�   2019-11-5 09:12
      
IP: 58.23.8.*   闁搞儳鍋涢ˇ锟� | 閻犙嶆嫹 閻犙嶆嫹 +1 [2]鐎殿喚濮寸换鍌炲棘閿燂拷   2019-11-5 09:08
闁告績鍋撻柟顕嗘嫹 闁挎冻鎷�    闁煎搫鍊搁幖銉︺亜閸濆嫬缍�
IP: 219.217.239.*   闁搞儳鍋涢ˇ锟� | 閻犙嶆嫹 閻犙嶆嫹 +1 [1]闁告碍娲栭弸锟�   2019-11-5 09:04
      

1/1 | 闁诡剚妲掗锟�:30 | 濡絾鐗犻妴锟� | 濞戞挸锕g粩瀛樸亜閿燂拷 | 濞戞挸顑勭粩瀛樸亜閿燂拷 | 闁哄牜鍋婇妴锟� | 閻犲搫鐤囧ù锟�

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-2-28 15:12

Powered by ScienceNet.cn

Copyright © 2007-2025 中国科学报社

返回顶部