独轮车上的博导分享 http://blog.sciencenet.cn/u/yanjx45 狂犬病、流感、结核病和人类遗传学科普园地。 提供根治 “狂犬病恐惧症” 的灵丹妙药。 奉献在中国彻底消除狂犬病的锦囊妙计。

博文

Science:含1,300万人的世界最大家谱的定量分析

已有 1440 次阅读 2018-3-11 13:29 |个人分类:姓氏文化|系统分类:科普集锦| Science, 家谱, 定量, 分析, 环境


该项家谱分析解答的遗传学和人类学问题:

1环境和基因对人的寿命的不同影响。

2家庭离散度和夫妻之间遗传相关性的变化趋势。


相关论文于201831日在线发表在专业杂志Science上,论文题目为

含数百万亲属的群体规模家谱的定量分析

Quantitative analysis of population-scale family trees with millions of relatives”

J. Kaplanis et al., Science 10.1126/science.aam9309 (2018).

本文结尾处有原文全文下载链接。)

 

家谱在遗传学、人类学和经济学等多个领域有着广泛的应用。然而,收集大型家庭的家谱资料常常是单调乏味的,通常所获得的资料的地理范围有限,且对数据的使用有复杂的限制。

美国哥伦比亚大学计算生物学家Yaniv Erlich和他的同事们利用网络交互平台的公开可用的在线数据库中群体规模家谱population-scale family trees数据来进行遗传学和人类学分析。

在家谱爱好者共享的网络交互平台Geni.com全球网络调研环境,Global Environment for Network Investigations)上,已有超过8,600万家谱爱好者填写了家族关系数据。该数据库包含的人数比23and me公司构建的顾客基因检测数据库中的人数还要多一个数量级。该项研究从该数据库中收集了8,600万份档案,提取人口统计数据,建立和验证群体规模家谱。结果共生成530万个没有关联的家谱其中包括一个迄今为止全球最大的家谱1,300万个成员,平均跨越了11代。这个家谱是基于大约3百万家谱爱好者汇集的数据。

这些由庞大数据库构建的巨型家谱,可追溯到几百年前,能解答很多疑问。

此项研究初步解答了遗传学和人类学中的两个疑问:

1,        环境和基因对人的寿命的不同影响:

你的寿命分别在多大程度上依赖于基因和环境?

作者讨论了长寿基因的传承,根据数据分析的结果是,以前的研究高估了寿命的遗传性,事实上基因发挥的作用要比科学家们原来预想的更少。因此,我们应该降低我们对于依据基因组数据预测寿命的能力的期望,并探索如何确定真正与长寿相关的基因变异。

作者分析了这个家谱中的人的出生日期和死亡日期,并计算出如果个人之间存在密切的亲缘关系,他们是否更有可能在相似的年龄死亡。

以往的一些研究,比如Mitchell团队在2001年发表的一项研究,估计人们的寿命差异有约25%是由基因决定的。该团队得出结论是,在这些人中,遗传仅能解释大约16%的寿命差异。大部分差异都归因于其他的因素,比如人们在哪里生活和如何生活。

 2,          家庭离散度和夫妻之间遗传相关性的变化趋势

对家族成员扩散理论的评估):

在分析了家谱里的迁徙和婚姻模式后,研究人员发现:女性离开家乡的人数比男性多,但当男性迁徙时,他们往往搬到更加遥远的地方。这种模式一直在延续,300年前是这样,300年后的今天依然如此。

此外,数据还被用来确定人们是什么时代停止与亲缘关系较近的人结婚的。研究人员发现,在1750年以前,这个数据库中的大多数美国人和欧洲人都嫁给了离他们的出生地最多10公里的人。1800年和1850年之间,结婚对象之间的距离增加了一倍——这可能是因为在欧洲和美国的大部分地区,随着交通工具的发达,铁路旅行成为可能。在这50年时间里,人们可以走得更远以寻找配偶。1870年工业革命后,这一距离迅速增加到约100公里。1950年,大多数美国人和欧洲人不得不到离他们的家乡至少100公里的地方才能找到配偶。
          1650年到1850年之间,已婚夫妇的平均遗传关系约为4代表亲。1850年以后,约为7代表亲。
          综合起来看,这些数据显示,家庭离散度增加和夫妻之间遗传相关性下降之间存在大约50年的滞后。

  在此期间,尽管距离增加,个人仍继续倾向于与较亲的人结婚。 根据这些结果,作者推测19世纪的交通运输变化并不是导致血缘关系下降的主要原因。相反,研究结果表明,转变的文化因素在西方社会近期夫妻遗传相关性的降低中发挥了更重要的作用。

 

在这项研究中,作者借助以家谱为主题的网络交互平台来构建涵盖西方世界几乎每个国家的大规模人类家谱数据库。 多重验证程序表明,这样获得的数据集dataset)与采用传统方式收集的资料具有相似质量,但规模更大,成本更低。

作者设想此数据集和类似的大数据集可以解决人类家谱研究中的定量问题,包括遗传学、人类学、公共卫生和经济学方面的问题。 这些家谱和人口统计数据可以采用匿名格式,从而可以对Geni全球网络调研环境)数据集进行静态分析。

作者还提供了一种动态方法,可以使用Geni API将参考数据库中的其他数据集与数据库进行整合。其他项目可以使用类似的策略为他们现有的数据库添加大量家谱资料。

推而广之,与以前的研究类似,此项研究还证明了在基础研究和遗传学家谱咨询数据集之间协作可能产生的协同作用。 随着人类数字化进程的不断发展和遗传学咨询行业的兴起,这种合作的努力可能是一条有价值的途径,以获取为解决生物医学研究中的基本问题所需的大量信息。


原文全文下载:

  Quantitative analysis of population-scale family trees with millions of relatives.pdf





http://blog.sciencenet.cn/blog-347754-1103332.html

上一篇:人体各部位被疯狗咬伤的概率和相应的狂犬病发病概率
下一篇:为避免衰老,锻炼是最佳选择

1 郑永军

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备14006957 )

GMT+8, 2018-9-22 17:02

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部