|
这项起步立意为对通用型蒙特卡罗模拟计算软件的控制管理软件,历经了二十余载岁月,初步演化构成一个专用型SGS数字孪生。伴随着这个过程,我对于数字孪生的见解也逐步定型。
作为被看作科学研究和技术开发第三途径的模拟计算的一个具体实现途径,我很欣赏安世亚太的田锋先生关于数字孪生分为先知型和先觉型的归纳总结。
所谓先知型数字孪生就是类似于我构建的SGS数字孪生,是基于机理而构建的;所谓先觉型数字孪生就是目前广泛流行的诸如数字城市等等,是基于数据模型而构建。前者遵循的是演绎逻辑;后者遵循的是归纳逻辑。前者所遵循的机理可以是目前公认的,也可以是尚未得到公众普遍认可的(我曾经参与过的高能重离子碰撞的模拟研究,由于属于前沿性研究课题缺乏足够的基础性数据,就采用纯猜想性的机理和数据);后者所遵循的是基于数据而生成的模型。这两者底层逻辑的差异决定了在解决具体问题时各自途径和流程的不同,下面以SGS透射测量重建失真修正问题的解决为例说明两者在解决问题时的不同。
首先共同的是都要对现有的结论产生怀疑,在这个例子中,我们首先要对SGS技术仅适用于中低密度测量对象这一公认的结论产生怀疑,这是两者共同的起点,如果没有这个起点,后面一切就将无从谈起。所以怀疑是创新的起点,没有怀疑就无从谈及创新。
从共同的怀疑出发,两者解决问题的途径还剩下一个共同步骤:遴选可能对失真修正因子存在影响的参数。经过分析可确定透射对象介质组成、透射射线能量以及探测器的物理属性等物理参数和透射源发射角分布、源-透射对象-探测器空间几何关系、透射对象厚度以及探测器的几何属性等几何参数对失真修正因子可能存在影响。至于这些参数各自在多大程度和什么方式对失真修正因子构成影响,是后续研究的对象。从此时起,先知型数字孪生和先觉型数字孪生在解决问题上的差异就逐渐体现出来了,两条解决问题的途径就此开始分道扬镳啦。
如果沿着先知型数字孪生的途径,基于确定的物理参数(确定的透射对象介质组成、确定的透射射线能谱以及确定的探测器物理参数)和确定的几何参数(可以表征确定的透射源空间发射角、可以确定的源-透射对象-探测器空间几何关系、确定的透射对象厚度以及确定的探测器几何参数),利用蒙特卡罗方法就可以得到由上述确定取值参数组合决定的失真修正因子。
如果沿着先觉型数字孪生的途径,首先需要假设存在一个基于上述物理与几何参数的(多元)失真修正因子函数,需要确定中各个参数的变化区间,需要确定各个参数的变化组合,需要筛选放弃没有影响或影响较微的参数。在此基础上需要通过(大量)试验获得系统参数集变化组合的失真修正因子,构成相应的数据库。基于该数据库中的试验数据拟合失真修正因子函数。对于确定取值的参数组合,通过插值可以得到相应的失真因子函数取值。
两条途径对于资源的需求有所不同,先知型需要足够的计算能力和进行判定性试验(适当的标准放射源、适当的标准试验对象和适当的试验装置)的能力,先觉型需要足够的实验能力(确定的标准放射源、确定的标准试验对象和确定的试验装置)和适当的计算能力。
上述两条实施途径均存在不同的风险。首先需要指出的是,对于风险的度量就是根据失真修正结果与实际情况之间差距大小而定。
对于先知型来说,可能存在的风险因素首先值得一提的是机理的风险,也就是从物理理论上讲所沿用的机理是否是正确的;其次是基础数据的风险。存在这样的情况,尽管物理理论上的基本规律是对的,但相应的基础数据存在偏差。上述两项风险是超越具体工作不受具体实施者控制的风险因素,体现了当前学界而非具体人员对若干基础性问题的掌握程度。与具体实施者有关的风险因素首先值得一提的是建模风险,在构建模拟计算对象时,如果实施者提供和使用的物理与几何数据与实际情况存在差异,就会导致最终计算结果出现系统性偏差;还有一种风险必须指出,这就是所采用的计算方法——蒙特卡罗模拟计算方法可能带来的偏差,比如目前尚未得到完整有效解决的深穿透问题,就有可能在处理厚屏蔽问题时来带显著的计算偏差(注意:是系统偏差而不是随机误差!)。上述风险均有可能导致最终计算结果出现系统性偏差。
针对先知型数字孪生所特有的风险因素,设计专门的验证性实验是降低和避免上述风险的有效方法。我在SGS数字孪生的研制中,就曾经依靠专门的验证性实验发现并解决了建模时由于使用的介质组成数据偏差导致最终模拟计算结果出现显著偏差的问题。
对于先觉型来说,首先需要指出的风险因素是数据获得性风险,也就是能否获得数据和能否获得准确的数据,对于以放射性测量为代表的特殊性问题,能否迈过试验门槛获得相应数据并非一件轻而易举的事情,更何况获得准确无误的数据;其次需要指出的数据处理风险,比如通常存在的拟合函数基的选择问题、非线性拟合问题以及对于拟合函数的内插与外推问题。数据获得性风险容易理解,不需要特别强调,而数据处理风险却非常容易被忽略。需要特别强调的是,就算基于准确无误的实验数据,数据处理过程中的错误依然会导致最终获得的失真修正因子函数出现偏差,进而导致对于确定参数取值组合插值得到的失真修正因子偏离实际情况。因此选择准确的实验数据和采用正确的数据处理方法,是降低和避免上述风险的有效方法,但这在实际中并非容易达成,需要针对具体问题思考具体的降低风险办法。
为了提高数字孪生的构建效率,提高数字孪生最终结果的准确程度和使用效率,需要针对不同类型的数字孪生采取不完全相同的技术对策。对于先知型,应该充分利用现有、经过验证的数据,这也就是所谓的知识工程化;应该充分发挥模拟计算优势,尽量通过模拟计算构建拟合函数。对先觉型,应该及时跟踪机理模型发展,应该尽量考虑引入已知的机理模型;应该增加基于机理的计算成分。归纳起来就是在先觉型中添加先知型所长的计算优势,利用先觉型的理论夯实先知型的基础。
也就是说,统计数据的确是科学研究的出发点,但科学研究绝不能止步于统计数据。(未完待续)
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-24 09:44
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社