ChengyangWang的个人博客分享 http://blog.sciencenet.cn/u/ChengyangWang

博文

Genome Biology第一作者访谈 | 怎样问生物学问题?

已有 7147 次阅读 2017-12-20 10:35 |个人分类:名家访谈|系统分类:科研笔记| genome, Biology第一作者访谈

 

本文转载自嘉因微信公众号,已获得授权。查看最新文章,敬请关注嘉因,微信ID:rainbow-genome

作者:小哈  来源:嘉因

8月31日Genome Biology上online的一篇文章,题目是:超短DNA低甲基化区域scUMC)调控人类高级染色质3D结构。BMC出版社专门约稿,请第一作者林雪秋博士做一作点评 | 超短DNA 低甲基化区域和染色质3D结构的关系(点击蓝字查看文章内容梗概)。

比起文章研究了哪些内容,小哈更喜欢八卦研究过程中的血泪史!~

生信入门路 | 生物/医学人的生信启蒙一文里,小哈请各学科背景的生信人介绍了生信学习、研究经验。林雪秋博士是其中的一位本科生物背景的美女,小哈这次请她分享一下做生物信息研究过程中的宝贵经验。一起跟秋秋美女学学:怎样问生物学问题?在做开创性研究的过程中遇到哪些瓶颈?怎样解决

括号()里的文字是小哈的碎碎念

Q:小领域内存在哪个生物学问题没解决?文章在什么程度上解决了具体哪个问题?


(怎样问生物学问题)

A:DNA甲基化修饰一直是备受关注的表观遗传修饰,DNA甲基化酶抑制剂是表观遗传癌症药物的一大类。自从2008年Whole-genome bisulfite sequencing (WGBS) 技术发表后,研究人员能够从全基因组视角,单碱基高分辨率对DNA甲基化在正常发育和肿瘤发生等多种生物学过程中的调控机制进行研究。生物信息学领域的研究人员在近十年已经检测了各种长的DNA 低甲基化元件并解析这些元件在启动子,增强子和转录因子结合区域的调控功能。比如,在2013年,任兵老师组、李蔚老师组分别定义了超长低甲基区域,DMV和Canyon,并分别在人胚胎干细胞系和老鼠干细胞系统初步解析了其调控功能。在2013这一年,我的第一篇小文章也发表了(Bioinformatics,IF=7.3,对于你来说是小文章),李蔚老师希望我接下来能够更大胆地尝试一些不确定性的探索

在一次讨论中,他提出,现在大家都在定义各种长的DNA元件,我们是不是可以反其道而行之,定义短的区域,从而更好地利用和挖掘WGBS数据的高通量和高分辩率。

但是,对于那些散布在全基因组高度甲基化背景(70%-80%CpG)中的单个低甲基化CpG,没有有效的计算方法将可信的具功能性的部分从大量随机分布的噪音中区分出来,从而进一步研究其在各种生物学过程中的调控功能。在这个过程我们花费了比较多的时间,中间也暂停了一段时间。


最后,scUMC这篇文章没有使用复杂的计算方法,而是从另一个角度出发,解决了这个问题,然后进一步探索了与染色质3D结构相关的调控功能,为表观遗传调控提供了新的研究思路。

Q:为了解决这个生物学问题,已有的工具或算法存在哪些不足?本文开发的算法或工具具有哪些优势,才解决了这个问题。

A:以往的DNA甲基化分析方法通常认为邻近的CpG甲基化水平事高度一致。因此,为了增加分析的可信度,传统方法通常要求低甲基化区域必须包括至少4个低甲基化CpG。在这个过程中,丢弃了大量的稀疏分布的低甲基化 CpG。另外,尽管WGBS是单碱基分辨率,但是传统的方法并不能从单碱基分辨率预测甲基化的功能

在尝试了各种相对复杂的机器学习方法后,我们scUMC这篇文章最终是改变了思维方法,从另一个维度出发,纵向借助大量高质量WGBS数据(31套人类正常细胞系WGBS数据)中单碱基低甲基化CpG在多个样本中的相关性,开发出新的计算方法,检测出功能性的单碱基低甲基化CpG。


Q:发现了新的调控元件,从哪些方面入手推测其功能?一定不只看了染色质高级结构这一方面,当初都做过哪些尝试?

A:相对于功能解析这部分,这个工作的大多尝试主要是在寻找开发有效的检测方法上。在功能推测上,我们一开始将这些调控元件跟ENCODE从大量定义出来的调控元件进行相关,发现scUMC跟只有CTCF的元件相关。DNA甲基化关联CTCF与DNA结合区域已经有很多研究进行阐释了,所以需要找出更独特的关注点

当时,我们停下来整理了一下CTCF的各种功能,及其跟DNA甲基化的关系。得益于近年来染色质高级结构的研究发现以及产生的高分辨率数据,比如ZNF143因子在DNA环中扮演角色的解析,自然而然有了相关的尝试和发现,以及进一步分析设计和尝试。

Q:遇到过哪些瓶颈?如何解决的?


A:这个工作的研究瓶颈主要在于思路的转换。一开始我们从单个WGBS数据出发,想通过序列和调控元件各种特征开发出炫酷的算法解决这个问题,但并没有得到很好的效果。这个郁闷的过程持续的时间有一年左右时间。


李蔚老师组里苏建忠博士在做另一个工作中,收集了所有公共的WGBS数据并做了相关分析,他的一次组里汇报激发了这个想法,后续跟导师和师兄的交流促使了这个工作有了质的变化。


因此,有时候策略选择比炫酷算法更重要,而策略选择往往跟你对生物问题的熟悉程度相关。另外,跟导师和同组成员的互动交流也很重要。


同时帮师兄发布一则招聘信息,点击蓝字查看详情癌症表观遗传学实验室诚聘生物信息等专业教师和科研人员


苏建忠博士2017年正式全职加入温州医科大学,筹建癌症表观遗传学实验室及生物信息专业。2014年初至2017年在美国贝勒医学院DanL. Duncan癌症中心李蔚教授实验室进行博士后研究,主要从事人类癌症表观调控因子挖掘,调控机制解析的研究,及高通量数据癌症表观遗传数据整合和挖掘算法及软件开发工作。在国际知名刊物发表了30余篇同行评议的论文, 其中以第一作者(共同第一作者)或通讯作者,在NatureGenetics, Nature Communication, Genome Biology, Nucleic Acid Research等国际一流杂志发表研究论文10余篇,开发算法软件及数据库6个。师兄人很nice,有实力有理想,有兴趣加入合作可查看实验室网站:http://sulab.info,进一步联系




https://blog.sciencenet.cn/blog-3372875-1090627.html

上一篇:课题方向选择、基金申请、艺术交流 —— IBW2017大会报告
下一篇:生信入门路 | 生物/医学人的生信启蒙
收藏 IP: 124.77.56.*| 热度|

1 陈刚

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-22 10:48

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部