从第1个到第1001个拟南芥基因组
已有 9086 次阅读
2011-10-16 01:13
|系统分类:观点评述|
基因组, 果蝇, 拟南芥, G10K, I5K
2000年Nature和Science分别发表了模式植物拟南芥和模式动物果蝇的基因组文章,此后基因组破译逐渐开始风生水起,第二代高通量测序仪的问世,又给物种基因组破译工作加入了新的燃油。
物种基因组序列的完成,为后期重测序分析,表观基因组学,转录组学等研究奠定了坚实的基础。作为后续研究之一,重测序通常将参考序列物种的亚种,变种,或不同生态型(以下统称为近缘种)的测序序列比对到已经破译的参考基因组序列上,发掘大量的SNP、InDel等第三代分子标记,进而进行PCA、群体结构、LD分析及系统进化分析等。尽管基于重测序技术的信息分析有着种种好处,但同时它也存在潜在风险:重测序获得的序列一般不进行从头组装,而是将测序序列直接比对到参考序列上,后期的分析是基于比对上序列开展的。但无论两个物种的序列相似度有多高,物种自身都有其所特有的序列,而这部分特有的或“新的”序列信息(http://en.wikipedia.org/wiki/Pan-genome),在后期分析中会丢失。其次,由于不进行从头组装,因此一些近缘物种上大片段复制(segmental duplication)现象也无法通过重测序进行研究。
由于重测序存在这样潜在的风险,以及随着大规模测序技术的发展,群基因组测序逐渐崭露头角。
2007年哈佛Broad及英国Sanger等研究机构针对果蝇科果蝇属中分布在不同地域的10种果蝇,进行了全基因组测序,并且和2000年及2005年分别发表在Science和Genome Research上的黑腹果蝇和拟暗果蝇,共12种果蝇基因组序列信息进行了比较分析,由此项目衍生的两篇研究成果发表于同期Nature(doi:10.1038/nature06340 & doi:10.1038/nature06341)。研究人员通过12个基因组序列的比较,发现了一些新的功能元件和罕见的基因结构,纠正了之前不正确的注释结果,并由此开发了一套比较基因组学方法。此外,通过12个果蝇基因组序列的比较,揭示了基因组水平上进化进程中不同种果蝇序列分化模式和速率。
2008年Salk Institue等研究机构发起了1001个拟南芥基因组测序计划,旨在将分布于全世界有代表性的1001株拟南芥品系(生态型)进行序列破译,发现全部的序列变异,并进行相关的GWAS研究。基于这个宏大的研究计划,其研究成果也源源不断的出现于PNAS,Nature,Nature Genetics上。
2009年华盛顿大学及霍华德休斯医学院等研究机构,针对灵长类5个物种基因组序列进行了比较基因组学和进化分析。人<灵长目人科人属>、黑猩猩<灵长目猩猩科黑猩猩属>、猩猩<灵长目猩猩科猩猩属>、猕猴<灵长目猴科猕猴属>及狨<灵长目卷尾猴科狨属>的基因组序列比较分析拓宽了人们对灵长类基因组进化的理解,揭示了灵长类物种形成及其生物适应的相关分子机制(doi:10.1146/annurev.genom.9.081307.164420)。
种种计划的发起和厚实的研究成果,再次印证了一个事实:One genome is not enough。
https://blog.sciencenet.cn/blog-285195-497280.html
上一篇:
中草药基因组 漫想下一篇:
上帝掷骰子了吗