|||
本文转载自嘉因微信公众号,已获得授权。查看最新文章,敬请关注嘉因,微信ID:rainbow-genome
作者:小哈 来源:嘉因
昨天央视新闻报道我国启动“十万人基因组计划”,早上看到生信技能树的《限制我们想象力的就是贫穷》,江苏今年十月已启动“百万人群基因组计划”。
如果我有钱有资源,那我是不是可以启动个“一亿人基因组计划”???
等等,好像有哪里不对
我静下心来思考了一下,这一亿人的基因组计划要如何设计?想挖掘出什么样的规律?找哪些人来测?怎样分组?都取血液、肿瘤组织?器官捐献者的组织要取哪些?怎样设对照?怎样设重复?
或者,不要那么麻烦,先测了再说?
翻了翻以前写的实验设计帖子:
再查了查几个国际项目的实验设计:
GTEx的实验设计
《把RNA跟基因型、疾病联系起来 | GTExPortal、dbGaP、recount2视频》
样本
GTEx收集了来自960个人,超过2万samples,53种tissue;
数据类型
RNA-seq
成果
鉴定了673个trans-eQTLs at 10% genome-wide FDR
ENCODE的实验设计
《ENCODE介绍视频 | 由ENCODE成员翁志萍教授亲自讲解》
样本
GTEx收集的捐献者的组织、原代细胞、以及其他细胞系。
数据类型
DNase-seq、ATAC-seq、组蛋白修饰的ChIP-seq、转录因子ChIP-seq、RNA-seq、RAMPAGE、RIP/CLIP-seq、DNA甲基化、ChIA-PET、Hi-C
成果
不管它发了多少CNS文章,反正查ENCODE数据已经成为我们日常科研中不可或缺的一步。
TCGA的实验设计
《TCGA教程大合集:不会编程是常态,但永远难不倒努力前行的临床医生》
样本
33种癌症,超过11000位患者的肿瘤样本以及配对的正常组织。
数据类型
临床数据、基因组或外显子组、RNA-seq
成果
高水平文章数不过来,临床上对哪个基因感兴趣,我就拿出手机查该基因的TCGA数据,看它在哪个组织表达量高,再上电脑看生存曲线
《装这个app,妈妈再不骂我捧着手机不干正事了 | 北大唐泽方GE-mini和GEPIA》
最后,得出这样的结论:
给我测一亿人基因组的钱,我也不测一亿人的基因组。
Q:测啥呢?
A:我收集1万中国某种癌症患者的肿瘤组织,尽量收集同一患者来源的正常组织做对照。做好临床数据的录入和标准化,测下面这些:
基因组
DNA甲基化
RNA-seq
eCLIP-seq
ATAC-seq
组蛋白修饰的ChIP-seq
转录因子的ChIP-seq
ChIA-PET
Hi-C
Q:为啥测一亿人基因组的钱,你做这9个实验就只能测1万人了?
A:基因组测序没啥技术门槛,有钱就能做。而ChIP-seq、ATAC-seq和eCLIP-seq技术门槛太高,国内能做好的人才太少了。我要从培养人才做起,21世纪最值钱的是人才。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-27 09:45
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社