基因大数据解读专家,奇云诺德创始人罗奇斌博士:解读测序密码——基因大数据解读 高通量测序技术可以对数百万个DNA进行同时测序,使得对一个物种的转录组和基因组进行细致全面的分析成为可能。随着人类基因组计划的完成和计算能力的快速发展,每个基因组的测序成本已从数百万美元降低至数百美元(并且还将继续降低),这将产生海量测序数据。医疗的真正大数据来源于基因检测。传统的医疗产生的数据通常才几十兆(M)字节,大型影像学检查已经达到几个GB,但这些影像信息更多是用于三维重构,而不是大数据分析。而在基因检测方面,一个人遗传密码可以用30亿个字符来描述,存储到文件里大小为3GB左右,利用主流的基因测序技术对遗传密码进行测定的话,所产生的原始数据超过90GB甚至几百GB,再加上蛋白质,加上影像系统好几个TB才能够做成一个人的数据。 解读测序密码是开启大健康领域的钥匙,高通量基因测序为快速迈入精准医疗时代提供了希望,但测序只是第一步,仅仅是得到了基因数据而已,还需要精准解读隐藏在基因大数据中的密码,才能真正揭示发病根源。华大基因现在一年才做几十万人,一年产生30多万PTB的数据,产生的数据和腾讯都是差不多的,如果是大人群更不得了,所以这是真正的大数据,每一个人的基因大数据。 |