|
14.9 加法维度与乘法维度
众所周知,我们认识事物总是以已知来学习未知。对于待识别对象,总是在原来了解基础上进行再学习。以熟悉的知识去认知陌生的未知,用已经了解的旧事物作为参照物去分析新事物。参照物是认知的基础。
并且,虽然大千世界千差万别,但都是由同一些基础零件堆砌组合而成的。比如,传统几何学是由10个基本公理构成的。
基本零件,搭积木似的加在一起构成的参照系,逻辑抽象叫做线性空间:
线性空间参照系的基本零件X、Y、Z,叫做特征基。一般以此为参照系来分析事物的特征属性。
表达式:aX+bY+cZ=P
其中X、Y、Z、P是向量,特征值a、b、c是标量
X、Y、Z、P是向量,代表一个单一特征属性,单方向箭头表示。因为特征基只有一阶属性,所以线性空间只具备一阶逻辑分析能力。
线性空间特征基之间都是线性无关的,口水话说就是特征基X和特征基Y没有关系,不能由特征基X去推导特征基Y,函数Y=f(X)在此没有意义。
线性空间只允许标量乘法,可以计算a*X,但是不允X和Y相乘。
再以上一节的例子探讨。最初,保险公司依据车辆“出险次数”筛选风险客户。然后,发现仅仅这一个维度不足以准确判断风险,又以不同车型的“车型零整比”作为第二个特征维度。再后,又添加“车辆使用年限”作为车辆风险的第3个维度。为了更精准识别风险,保险机构还可以增加更多特征维度,从n维到n+1维,甚至无穷维。但是哥德尔证明了,哪怕无穷维线性空间依然是不完备的。
既然单特征的向量空间(线性空间)不完备,那么把向量特征基加法参照系加以扩充,顺理成章考虑,就是引入特征基乘法。
现实情况也吻合这样的考虑。比如,司机因素和车辆因素对于事故的影响,并不是两种特征标签简单的加法关系。不难发现,司机对于车辆的安全行驶的影响,是一种复合作用。可见,特征属性乘法,对客观分析演算而言不可避免。
‘驾驶员画像’乘以‘车辆画像’得到‘车辆事故复合画像’。
模型是:(“驾驶员交通违法记录”+“驾驶员年龄”+“驾驶员性别”)*(“车辆出险次数”+“车型零整比”+“车辆使用年限”)
两种特征乘积的数学抽象是二阶张量(即矩阵):
同样道理,我们也可以把车辆行驶场景(行驶路线、行驶区域路况、行驶区域天气等)特征标签,作为另一个层次的特征,也纳入风险识别的复合因素:
为了更精确演算风险,还可以考虑更多的特征层次,比如执法部门处罚力度特征层、当地人文环境特征层等等,一层一层地纳入复合特征的高阶乘积:
假设上述每一层的特征标签都是3维的,则此5层线性空间的乘积是5阶3维张量。其中,3表示一层线性空间的维度;5表示张量的阶数,即5重特征属性的复合乘积。
习惯传统思维的人喜欢把5阶3维张量看作243维特征值参数的线性空间,然而这种肤浅认识无法洞察加法逻辑表象背后更高层次的乘法(群)脉络。因为表达特征属性乘法的高阶张量,一定内含群结构。
更有意义的是,群结构也是有维度的。群总是由不同的生成元构成的,生成元的个数就是群的维度。
通常,张量场可看作一个线性空间到另一个线性空间的线性变换构造的系综。
简单来看,双线性空间的二重线性(乘积),其流形联络就是线性变换。流形联络,微分(向量Y/向量X)通常并不是标量,而是向量,这说明线性变换本身是具有特征属性的。线性变换是一种特征属性线性空间到另一特征属性线性空间的复合作用,所以线性变换本质即特征乘法。如果基矢量X和基矢量Y相乘,则称为二阶张量,特征基的乘法次数称为“阶”。
以线性变换为元素,构成一个乘法群。多个线性变换的作用,即群作用。群生成元的维度,一般代表线性变换的乘法特征维度。而线性空间的维度,则代表特征属性的加法维度。二者完全不是一回事!!!
比如,我们常说的长、宽、高三个维度,指的是线性空间,是特征加法维度。
比如,庞加莱10维空间,指的是4个平移、4个转动、4个伪转动的群生成元,是特征乘法维度。
特征标签不仅仅可以相加,还可以相乘。
特征维度不仅仅有加法维度,还有乘法维度。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-29 12:45
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社