理想的光亮-张林分享 http://blog.sciencenet.cn/u/Zhanglincn 理想是一种明知不能得到但却必须要有的东西。

博文

我们不知道答案的125个科学问题(17)生物大数据背后的图像 精选

已有 5680 次阅读 2021-7-3 19:27 |个人分类:科学教育|系统分类:科普集锦

上接第16个问题的链接:http://blog.sciencenet.cn/home.php?mod=space&uid=318012&do=blog&id=1292142 

 

题记:又一个生物学方面的综合性问题,由于并非本人专业,只能就字论意,对照翻译,无法太过解读,问题的详情如下:https://science.sciencemag.org/content/309/5731/94 


How Will Big Pictures Emerge From a Sea of Biological Data?

海量生物学数据背后的物理图像是什么?

 生物学领域已经积累了丰富的原始数据,而且这些数据还在以更快的方式不断产生和完善。现在基于大规模样本探测的方法和技术加速了生物数据量的增长,例如大规模的DNA测序、基于微阵列的快速生物样本测试、全自动的基因功能测试以及人工智能和机器学习在生物实验上的应用等等,这些技术的发展进一步推动了生物大数据的积累和更新,使得世界各地共享和非共享的生物数据库都已接近饱和的边缘。现在从生物力学到生态学的许多子领域都已经数字化,而且观测数据变得更加精准和全面。现在几乎所有生物学领域都面临一个核心问题:能否从这些分子生物数据的洪流中揭示出生物系统和整个生物体是如何工作的,是基于哪些基本规律运行的?为了回答这个问题,所有的数据信息不仅需要重新筛选、组织和编译,最重要的是要找到这些分立数据间的联系,从而可以从这些数据的关联中对生物体做出基于一般性原理的准确预言和判断。

F1.medium.gif

图1 系统论的方法。上图可以显示不同神经细胞的联系和功能(来自网络)

 如今,生物学已经进入了系统生物学时代,虽然这个新出现的生物学名词定义模糊而且还未形成明确的发展方向,但它的研究目标就是要将几十年来在分子、细胞、有机体甚至环境层次观测到的生物学数据放在一起来寻找关键数据点之间的联系。系统生物学试图通过数学、工程学和计算机科学的方法建立起一个严格的理论框架,将生物学不同领域看似独立的数据和发现通过这一框架和模型彼此联系起来,从而使生物学的研究更加客观定量化。系统生物学的支持者认为,这应该是生物领域取得进展的唯一途径。他们还认为,系统生物学对生物医学的发展,特别是在破译机体疾病的致病机理方面,将具有巨大的推动作用。  

 人类基因组序列计划的完成极大地促进了系统生物学领域的发展。人类基因组序列是一项庞大的不亚于登月计划的系统工程,人类基因组序列图谱的出现表明人类把生物遗传和进化从另一个更为微观的生物化学层次进行了重新的定义和测量。这项工程激发了研究人员试图在其他更多的机制方面去揭示生物体的生命过程。 


DNA_Translation_and_Codons-02.jpg

图2 基因序列及蛋白质表达控制网(来自网络)

 分子遗传学家梦想对控制基因背后的网络有一个类似人类基因图谱的全面认识。例如,他们想找到DNA如何在不同的环境下表达不同的蛋白质,或如何调节其表达不同蛋白质的种类和数量(图2,可参见第3个问题:基因的数目)。细胞生物学家通过生物分子调控细胞的健康,追踪到了细胞之间复杂的信息通讯模式,他们想弄清楚这些复杂的通讯模式背后是否存在一套简单的信号传递规则。发育生物学家则想要得到胚胎发育过程的一个全面的图景:胚胎细胞是如何引导少数几个干细胞逐渐分化成大量在骨骼、血液和皮肤组织里实现不同特定功能的特殊细胞(见第8个问题:细胞的分化)。显然这些难题的解答只能通过系统生物学的方法来实现。同样对于神经科学家来说,他们也试图寻找隐藏在复杂大脑神经回路中的集体涌现现象,比如高级思想的产生(见第2个问题:意识的物质基础)。更宏观的尺度下,为了理解包括全球变暖在内的生态系统变化问题,生态学家则更需要将物理模型数据和生物数据结合到他们的思维之中统一加以考虑。

 今天,系统生物学家才刚刚开始研究一些相对简单的数据网络。他们已经研究出酵母菌分解半乳糖(一种碳水化合物)的代谢途径。另一些人追踪了海胆和其他生物胚胎发育的最初几个小时,目的是观察不同的转录因子是如何随着时间的推移改变基因表达的。研究人员正在发展支配细胞信号网络和简单大脑回路网络运行的基本理论模型。 

OIP-C.99ctu4Bi5TKx8061uUKrVQHaDc.jpg

图3 神经网络的连接示意图(来自网络)

 将生物网路的复杂模式转化为计算机可以模拟的理论模型的困难性限制了系统生物学研究的进一步发展。网络计算模型本身是相对简单的,但如何用一种研究人员都能够理解和解释的方法或模型去描述真实的生物学数据,以及如何利用理论模型的模拟结果去理解真实数据的研究工作还需要继续不断改进。目前,世界各地都在成立新的交叉学科类的研究机构,他们召集了由生物学家、数学家和计算机专家组成的跨学科研究团队,帮助推进系统生物学的研究工作。 但无论如何,它的发展目前仍处于起步阶段。总之,从目前的发展来看,还没有人能够知道,随着大量交叉学科研究工作的发展和不断提升的数值计算能力,科学家们能否可以找到隐藏在生物大数据背后的一个完整而规则的生命图像,而这个图像能够完全揭示和演绎生命体的生命过程究竟是如何运作的。

——Elizabeth Pennisi 撰文,张林 编译




https://blog.sciencenet.cn/blog-318012-1293924.html

上一篇:我们不知道答案的125个科学问题(16)群体合作行为的演化
下一篇:我们不知道的125个科学问题(18)化学自组装的未来
收藏 IP: 219.244.177.*| 热度|

9 许培扬 黄永义 张学文 王庆浩 胡大伟 曾杰 张鹰 guest68200206 guest91915963

该博文允许注册用户评论 请点击登录 评论 (9 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-23 03:49

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部