除了转录活性,ENCODE项目组还援引了另外一方面的数据:人类功能SNP(专业术语叫GWAS SNP)。后者发现了很多影响或者决定人类各种表型特征或疾病的单核苷酸变异。这些变异除了少量发生在编码序列外,多数发生在调控蛋白结合位点等ENCODE项目组发现的调控活性区域。这些序列的变异确实影响了生物体的表型,它们的存在不能说是可有可无的。但我们发现,功能SNP的覆盖度太低。以调控蛋白结合位点为例,平均429000个结合调控蛋白质的碱基序列才有一个已经证明的功能SNP。而一般的转录因子结合位点长度是10个碱基。也就是说,功能SNP可以证明一些生化活性区域是有用的,但功能SNP证明的区域占ENCODE报道的区域的很小比例。大部分有生化活性的区域仍未证实。另外,考虑到衰老的进化理论、基因突变的gain of function等因素,即便是功能SNP也不敢100%说就一定有用。
1、Ponting C.P. and R.C. Hardison (2011)What fraction of the human genome is functional?, Genome Res. 21:1769-1776. 2、Ward L.D. and M. Kellis (2012)Evidence of abundant purifying selection in humans for recently acquired regulatory functions, Science 337:1675-1678. 3、Lindblad-Toh K., et al. (2011) A high-resolution map of human evolutionary constraint using 29 mammals, Nature 478: 476-482. 4、Takashima Y., et al. (2011) Intronic delay is essential for oscillatory expression in the segmentation clock, Proc. Natl. Acad. Sci. USA 108: 3300-3305. 5、Giaever G.(2002)Functional profiling of the Saccharomyces cerevisiae genome, Nature 418:387-391. 6、Hillenmeyer M.E., et al. (2008) The chemical genomic portrait of yeast: Uncovering a phenotype for all genes, Science 320: 362-365.