||
写在前面
在PLoS Computational Biology杂志中,曾经发表了一篇标题为《Ten simple rules for biologists initiating a collaboration with computer scientists》(图1)的文章。当生物学家想与计算机学家合作时,里面的第一条规则是:不要试图将计算机学家变成生物学家(Do not try to turn them into biologists)。生物学家要想避开这个雷区,有必要了解一下机器学习方面的知识。这次就推荐一个指南。
图1 生物学家与计算机学家合作10条准则
01
—
动机
在生物学中,生物数据的大体量和复杂性对机器学习的需求日益增长,机器学习方法旨在构建隐藏在生物过程中的信息和预测模型。所有机器学习技术依赖数据拟合模型,然而机器学习方法具有特异性。因此,有必要对一些重要的机器学习技术(包括深度神经网络)进行梳理。另外一方面,不同机器学习技术可能适用于特定的生物数据类型,当生物学家想利用机器学习开展生物学实验时,提供合适的机器学习方法将会事半功倍。这些都是综述文章《A guide to machine learning for biologists》(图2)要解决的问题。
图2 生物学家机器学习指南
02
—
内容
文献《A guide to machine learning for biologists》从基本概念(包括基本术语,监督和非监督学习,分类、回归和聚类问题,类别和标签,损失和代价函数,参数和超参数,训练、验证和测试,执行机器学习,过拟合和欠拟合,折中归纳偏差和方差偏差)、传统机器学习到人工神经网络进行了综述,还对机器学习应用于生物学所面临的挑战进行了阐述。详细内容见文献[1]。
后话
机器学习是辅助生物实验设计的良好工具和手段,本文献是生物学家和计算生物学家了解机器学习良好的入门综述。可以充当手册及时查阅基本的概念和方法适用范围。
参考文献:
[1] Greener JG, Kandathil SM, Moffat L, Jones DT. A guide to machine learning for biologists. Nat Rev Mol Cell Biol. 2022 Jan;23(1):40-55. doi: 10.1038/s41580-021-00407-0. Epub 2021 Sep 13. PMID: 34518686.
[2] Cechova M. Ten simple rules for biologists initiating a collaboration with computer scientists. PLoS Comput Biol. 2020 Oct 22;16(10):e1008281. doi: 10.1371/journal.pcbi.1008281. PMID: 33091012; PMCID: PMC7580977.
更多背景知识如下:
1. miRNA是何方神圣?
11. miRNA靶基因识别
12. miRNA靶基因识别:下一步
14. miRNA靶基因之预测型数据库
15. miRNA靶基因之综合型数据库
16. miRNA靶基因之miRLAB
18. miRNA与TF互为调控
19. miRNA与人类疾病
20. miRNA靶基因与人类疾病
21. miRNA与EMT
22. miRNA协作
23. miRNA协作之MFSN
24. miRNA协作之因果推理方法
25. 单细胞水平miRNA调控
26. miRNA靶基因识别之IDA
27. EMT,你怎么那么多调控因子!
30. miRNA靶基因识别之hiddenICP
31. miRNA活性识别之因果推理方法
32. 因果推理综述推荐一篇
33. 构建条件单细胞基因调控网络
号外,为了便于交流,我们为miRNA介导的ceRNA研究在Frontiers in Molecular Biosciences杂志( 2020_IF = 5.246)整了个专刊,主题为“Computational Identification of ceRNA Regulation”。投稿链接:https://www.frontiersin.org/research-topics/24340/。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-9 23:55
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社