Leeye的个人博客分享 http://blog.sciencenet.cn/u/Leeye

博文

衔接自然科学与机器学习

已有 1314 次阅读 2023-5-26 17:59 |系统分类:观点评述

 

自然科学与机器学习之间如何实现有效的衔接?我们从知识维度空间和数字化两个方面分析一下。


首先,现有的知识体系对复杂对象的描述往往是定性的而不是定量的,例如生物医药领域。为了对研究对象进行精确解释,需要增加知识维度空间的连续性和交叉性,即利用多个相关联的知识领域来构建一个高维度的知识网络。这样可以将现象定位到交叉空间的精确点位上,而不是用一条或几条低维度的知识来割裂复杂空间。


例如,对于一个生物分子的结构和功能,我们不能仅仅用化学式或者分子模型来描述,而需要结合生物学、物理学、数学等多个领域的知识,来构建一个包含原子、分子、细胞、组织、器官等多个层次的高维度网络。这样,我们就可以更好地理解生物分子在不同层次上的作用机制和相互作用关系,以及它们如何响应外部刺激和环境变化。


为了对研究对象进行精确解释,我们需要增加知识维度空间的连续性和交叉性。连续性是指在一个知识领域内部,不同层级或尺度之间的信息和规律能够相互衔接和转换。例如,在生物医药领域,我们需要将分子层面、细胞层面、组织层面、器官层面、个体层面等不同层级之间的信息和规律进行整合和对应。交叉性是指在不同知识领域之间,能够找到共同点或联系,并利用多个相关联的知识领域来构建一个高维度的知识网络。例如,在生物医药领域,我们需要将生物学、医学、化学、物理学等多个子领域之间的信息和规律进行融合和互补。


通过增加知识维度空间的连续性和交叉性,我们可以将现象定位到交叉空间的精确点位上,而不是用一条或几条低维度的知识来割裂复杂空间。这样可以使我们对复杂对象有更深入和全面的理解,并为其提供更有效和精准的解决方案。


知识维度空间的增加,也意味着需要更多的数据来支撑我们的知识网络。然而,现实中,我们往往面临着数据稀缺、数据质量低、数据获取成本高等问题。因此,需要借助机器学习的方法,来从有限的数据中提取有效的信息,并且利用已有的知识来指导机器学习模型的训练和优化。


数字化过程中存在信息丢失问题。数字化将真实物质对象转化为机器学习模型所需的输入数据。由于真实物质对象具有超级复杂性,而现有数据描述方法往往过于简化或扭曲了物质对象内部所蕴含的复杂信息。因此,建议构建一个辅助网络,以实现机器学习模型的解释功能。辅助网络是通过既有知识来构建的,并与机器学习网络平行或相关联。它可以将机器学习网络产生的输出结果与物质对象内部信息进行对应,并提供给人类阅读和理解。


例如,对于一个药物分子与靶标蛋白之间的相互作用,我们不能仅仅用一个二维图像或者一个数值来表示,而需要结合药理学、生物化学、分子动力学等多个领域的知识,来构建一个包含药物分子结构、靶标蛋白结构、相互作用位点、相互作用能量、相互作用动力学等多个属性的辅助网络。这样,我们就可以更好地理解药物分子与靶标蛋白之间的结合模式和影响因素,以及它们如何影响生物系统中其他分子和信号通路。


辅助网络的构建,也意味着需要更多的先验知识来指导我们的数字化过程。然而,现实中,我们往往面临着先验知识不足、先验知识不准确等问题。因此,需要借助机器学习的方法,来从数据中发现新的先验知识,并且利用已有的数据来验证和修正先验知识。


在一些具体的研究方策略,利用高通量实验来研究节点动力学,通过连续变化的刺激集合来确定网络层级功能和节点定义。高通量实验利用自动化设备和计算机技术,在短时间内进行大量并行实验,并同时收集大量数据,可以有效地提高研究效率和覆盖范围,并且可以发现一些传统实验难以观察到的规律和现象。高通量实验在自然科学与机器学习之间起到了桥梁作用,可以为机器学习模型提供大量丰富多样的训练数据,也可以利用机器学习模型对实验结果进行快速有效地分析和预测。

 

可以看出,自然科学与机器学习之间存在着互补互助的关系,通过知识维度空间的增加、数字化过程中的信息丢失问题的解决、高通量实验、节点动力学、网络层级功能和节点定义等研究方向和策略,可以实现自然科学与机器学习之间的有效衔接,从而推动以物质为核心的自然科学门类的发展。

 




https://blog.sciencenet.cn/blog-3244891-1389525.html

上一篇:漫谈AI时代的环境毒理学研究
下一篇:地下水污染的抗生素污染比较严重
收藏 IP: 111.21.211.*| 热度|

3 许培扬 宁利中 吴斌

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-25 02:53

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部