majianthu的个人博客分享 http://blog.sciencenet.cn/u/majianthu

博文

Copula熵的多学科实际应用 (二)

已有 646 次阅读 2021-10-5 07:21 |系统分类:论文交流

本博文继续上篇博文,介绍Copula熵的多学科应用,包括生态学、公共卫生学、制造工程、可靠性工程四个学科领域。

生态学

在生态学中,动物运动轨迹研究是一个重要的基本问题,可以揭示种群活动规律、种群间的竞争关系,以及种群和环境资源之间的互动等基本生态学过程。信息技术在生态领域的利用生成了大量的动物轨迹数据,对这些数据的分析需要合理的建模方法。环线数据(circular-linear data)是生态学中的一种常见的时序数据类型,描述了离散化的动物运动过程,包括运动方向和运动距离两个变量。此二变量之间通常是相关的,即直线运动时运动方向较小而运动距离较大,转向运动时运动方向较大而运动距离较小,同时运动方向变量的分布一般是对称的,因此通常采用角度对称的环线 copula 函数作为工具对此类数据进行建模,并利用基于 copula 的相关性度量来衡量二者之间的相关性。 Hodel和 Fleberg [1] 实现了环线 copula 的建模和分析的算法工具包 Cylcop,其中包含了基于 CE 的互信息估计算法作为相关性度量方法,用于分析动物轨迹数据。

公共卫生学

公共卫生学关心的是群体的健康状况的监测、分析和干预。分析来自人群的健康监测数据是所有工作的基础,可以增加对群体健康状况的了解,为公共卫生政策提供实证证据。合理的分析工具是分析结论可靠的前提。Ma[2] 利用 CE关联分析方法,研究了美国全国健康和营养体检调查(NHANES)数据中的实验室化验数据,估计化验变量之间的关联强度,首次发现了化验变量分组关联的现象,并利用公共卫生学知识解释了分组变量对应的群体健康风险因素涵义,如糖尿病、环境重金属、塑料消费品使用等。

流行病是公共卫生学的另一个重要话题,流行病患者的及时诊断对控制流行病的传播至关重要。感染了流行病毒的病人往往伴有发热等症状,很难与正常的发热病人进行区分。目前正在流行的新型冠状病毒患者就具有这样的发热症状,基于临床数据开发能够区分病毒感染者和正常流感病人的技术成为一个紧迫的问题。然而,相关的症状有 10 几种,如何选择合适的变量集合成为研究成功的关键。 Mesiar 和 Sheikhi[3] 基于 CE 变量选择方法,利用真实的临床数据,分析了新冠患者诊断相关的 19 种症状变量,发现年龄、疲劳和恶心呕吐是最重要的诊断变量,可以使诊断达到 85% 的诊断准确率,如果将诊断变量增加到 15 个,准确率可以提高到 91.4%。

制造工程

产品质量是制造业的生命。注射成型(injection molding)是近年快速发展的工业制造技术,在航天、建筑、通讯等领域有着广泛应用。注射成型过程包括了多步复杂的物理和化学反应过程,很容易受到外部因素的影响,保证塑料产品质量的稳定性是一个难题。基于制造过程历史数据,建立产品质量预测模型是提高产品质量的手段之一。但建立模型需要首先选择有关的过程参数作为模型输入,以获得较好的预测性能。 Sun 等 [4] 提出基于 CE 方法选择过程参数变量用于构建质量预测模型,并将方法应用于真实的富士康公司的注射成型生产过程数据,大幅改善了质量预测的性能。

可靠性工程

退化过程(degradation processes)在各种工程系统中普遍存在,导致系统可靠性的降低甚至失效,如金属材料的疲劳和腐蚀、半导体器件的参数漂移等。退化过程建模是评估系统和产品有效性和寿命的主要技术手段之一。由于现代系统的复杂性,影响退化过程的因素较多,因素变量本身具有非线性特征,且变量之间又相互关联,从而对退化过程建模构成了可靠性工程的一个基本难题。如果建模时忽略了因素之间的相关性,就会导致模型错误和可靠性估计误差。传统的衡量因素之间的相关性主要采用线性相关系数,难以处理复杂的相关关系。Sun 等 [5] 提出采用 copula 对过程因素之间关系建模,并用 CE 来度量退化过程因素之间的关联。他给出了一种参数化 CE 估计方法,并成功应用于微波电子组件的退化过程分析中。结果表明,该方法能够分析不同阶段的退化过程。

更多应用介绍,见 马健(2021).Copula熵:理论和应用.[ChinaXiv:202105.00070

参考文献

  1. Florian H. Hodel and John R. Fieberg. Cylcop: An R package for circularlinear copulae with angular symmetry. bioRxiv, page 2021.07.14.452253, 2021.

  2. Jian Ma. Discovering association with copula entropy. arXiv preprint arXiv:1907.12268, 2019.

  3. Radko Mesiar and Ayyub Sheikhi. Nonlinear random forest classification, a copula-based approach. Applied Sciences, 11(15), 2021.

  4. Yan-Ning Sun, Yu Chen, Wu-Yin Wang, Hong-Wei Xu, and Wei Qin. Modelling and prediction of injection molding process using copula entropy and multi-output svr. In IEEE 17th International Conference on Automation Science and Engineering, 2021.

  5. Fuqiang Sun, Wendi Zhang, Ning Wang, and Wei Zhang. A copula entropy approach to dependence measurement for multiple degradation processes. Entropy, 21(8):724, 2019.




http://blog.sciencenet.cn/blog-3018268-1306781.html

上一篇:Copula熵的多学科实际应用
下一篇:Copula熵的多学科实际应用 (三)

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2021-12-1 06:21

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部