其次,关于多变量的相关性度量。根据定义,互信息度量的是两个随机变量之间的相关性。因此很自然地,有很多学者研究如何将互信息定义从二变量扩展到多变量的情况,其中较为著名的概念包括Total correlation, common information, conditional MI, 以及watanabe1960等都给出了互信息的多变量扩展形式。Copula熵是定义在一组随机变量之上的,且符合对称性,因此是一种互信息的多变量形式扩展,用于衡量多个随机变量的相关性。这为研究复杂系统中各个因素之间的统计关系提供了数学工具。
再次,互信息的估计。一直以来,如何估计互信息是信息论实际应用中的一个基本问题。一般是Plug-in法,先估计概率密度,再估计联合熵和边缘熵,从而根据定义得到互信息的估计;也有学者利用非参数方法估计互信息。而Ma和Sun基于Copula熵和互信息的等价性证明,给出了一种简单的非参数的互信息估计方法,方法包含两个步骤:先根据序数统计量估计Copula密度,再估计Copula熵,由于熵估计的方法很多,这里也可以利用非参数的方法估计Copula熵。这种方法以Copula熵理论为基础,思路清晰且计算简便,且每一步均采用非参数方法,因此广泛适用,相对其他方法具有很强的竞争力。
6. 新的研究问题
Copula熵的提出,为很多问题的解决带来了新的思路。
1)比如信道容量估计问题。信道容量定义为输入和输出之间最大的互信息。根据互信息和Copula熵的等价性,求解信道容量就等价于最大(Copula)熵问题。2)信息论较多的应用于高斯信道,著名的香农公式就是求解高斯信道的容量,引入Copula熵概念后,我们可以利用Copula理论与信息论的关系,求解非高斯信道的容量计算问题;3)Copula熵也为数据分析带来了新的分析哲学,由于Copula熵与边缘函数无关,因此可以在考虑随机变量为非高斯变量的情况,同时,Copula熵可以用来衡量全阶次的、多变量的非线性相关性,这在分析的问题日益复杂的情况下具有十分重要的意义;3)考虑到相关性与因果关系之间的紧密联系,Copula熵也可以用来分析复杂系统中多变量之间的因果关系。
7. 结论
信息论是介于应用数学、电子工程和计算机科学之间的交叉性学科,与统计物理等有着密切的内在联系。信息论的基本概念在其他学科交叉领域具有广泛的应用,起着基础性的引领作用。Copula熵定义了一种全阶次、多变量的非线性相关性度量概念,融合了香农熵和互信息等基本概念,扩展了信息论的理论和应用边界,必将对相关学科研究和应用产生根本性的影响。
参考文献
1. Ma Jian and Sun Zengqi. Mutual information is copula entropy. arXiv preprint
arXiv:0808.0845, 2008.
2. Shannon C E. A mathematical theory of communication. Bell System Technical Journal, 1948, 27(3):3 - 55.