CrazyAlex的个人博客分享 http://blog.sciencenet.cn/u/CrazyAlex

博文

量变引起质变-生物信息大数据

已有 492 次阅读 2023-12-17 23:39 |系统分类:科研笔记

在机器学习领域,有一个流传很广的说法:Garbage in, garbage out. 一定程度上来说这个确实没什么毛病,尤其是在数据量小的时候,数据的质量往往决定了模型的好坏。

近些年随着时间的推移,生物信息数据呈现指数爆炸式的增长,不仅仅多中心,多种族,并且呈现多模态。但按照目前的研究状况来说,因为各个研究的独立性,我们确实很难保证统一的研究数据质量。

然而我想说的是,数据,他就在那里!这无疑是一个宝藏,但能发现什么,能揭示什么现象,参透什么原理,全靠各自的本事。当我们的模型输入数据大到一定的程度,引起质变只是一个时间问题,尽管有可能到最后,我们仍然不知道从分子底层到表型顶层的中间机制是什么。

谈到机制,最近看到一个特别有意思的观点,机制的理解建立在大家有大部分的共识。当我们在解释机制时,往往会用更精细的事物名词,或另一个不同层面的东西来进行阐述,说服。但大家必须承认用来解释该机制的事物的合理性。打个比方说,当有人问太阳为什么从东边升起的时候,我们可能回答由于地球在自转。但是如果另一个人对对地球自转都不能承认不能理解的时候,我们就必须继续深入解释,一步一步。。。




https://blog.sciencenet.cn/blog-3499566-1414255.html

上一篇:系统哲学理解复杂疾病
收藏 IP: 96.230.2.*| 热度|

2 李升伟 农绍庄

该博文允许注册用户评论 请点击登录 评论 (3 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-28 01:53

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部