|
14.8 特征相乘
下图是小学生应用题,要求5秒钟口算得出答案:
大家通常的习惯性算法是:
设狗、猫、兔分别为x、y、z公斤,有:
y+z=10
x+z=20
x+y=24
推出:x=17,y=7,z=3
所以:x+y+z=17+7+3=27
但是,上述演算显然满足不了5秒钟口算的要求。
如果学生有较强的洞察力,就能一目了然、看透外表、直达本质,发现第一、二、三张图相加,刚好是第四张图里面动物的两倍。简单心算(10+20+24)/ 2 = 27 ,立马得到准确答案。
本题简算有效,有两个要点,一是无需求出狗、猫、兔的分别重量,只需笼统合计数即可;二是引入了乘除法运算,升级了加法代数。
洞察逻辑表象背后更高层次的脉络,对于当前似乎陷入寒冬的人工智能领域,有着特别的启发意义。
前几年轰动一时的深度学习,更广泛应用好像遇到某种瓶颈。那么,AI三要素:数据、计算力、算法,谁是拖累发展后劲的罪魁祸首呢?
首先,数据量不是瓶颈。随着社会各行各业拥抱数字化,以及廉价云服务的普及,进一步推动了大数据爆发。据说现今最近一个年度内产生的新数据,就相当于人类诞生以来1万年至两年之前的所有数据量总和。
其次,计算力不是瓶颈。OpenAI调查表明AI计算力提升远超摩尔定理限制,目前AI计算力已经实现3.5个月翻一番,从2012年谷歌大脑到2017年alphaGo深度学习计算力提升了30万倍,而且GPU和TPU芯片还在加速这种趋势。
很显然,AI发展的瓶颈在于算法。而解决AI算法瓶颈,亟待传统理论的突破。很多学者都发现,自从量子力学和相对论诞生以后,自然科学基础理论似乎陷入了极其严重的漩涡,无法自拔。量子理学以上帝投骰子为原理,相对论时间变短尺度变长,如此解读难道不荒谬吗?
究其根本,这种荒谬的根本原因在于,我们习惯于以沿用了两千年的公理系统框架来解读自然科学。公理系统的理论框架是线性空间,而线性空间参照系的特征基是向量,向量只表达一阶特征属性,所以线性空间(向量空间)只能表达一阶逻辑的系统。而量子力学和相对论是高阶逻辑的,高阶逻辑系统的特征属性具有高阶特征。
所谓高阶特征,也就是特征与特征的复合作用,即特征属性与特征属性的乘积。在一阶逻辑系统中,特征属性是一个一个维度加出来的,比如n维特征空间、扩展到n+1维特征空间、再扩展到n+2维特征空间。一阶逻辑系统中,特征属性只能相加,不能相乘。一阶逻辑系统中,不能出现“桌子乘以椅子”、“司机乘以车辆”、“人品属性乘以借贷属性”等等多重特征的复合谓词。高阶复合特征属性,对于一阶逻辑是无意义的。然而,高阶复合特征属性(特征相乘)却往往隐藏着更高层次的逻辑脉络,意味着更高层次的洞察力演算。类似算术乘法相比算术加法是更高层次的演算,群论(群生成元的乘法)有时比线性空间(特征基的加法)更具优势。
下面,以一个简单例子来说明深度学习模型中的复合特征(特征相乘)的乘法算法的重大意义:
保险公司本质是经营风险,为了屏蔽高风险业务,保险业制定了依据车辆出险频率收费的策略。上年出险次数多的车辆需要缴纳高额保险费,反之出险次数越少优惠折扣越大。显然,“出险次数”是车辆保险筛选客户的重要指标。
为了更准确判断车辆赔付风险,保险公司还把不同车型的“车型零整比”作为另一个特征标签。
另外,有的保险公司也把“车辆使用年限”作为车辆风险特征属性的第3个关键维度。
以“出险次数”、“车型零整比”、“车辆使用年限”等3个特征维度,在一定程度上提供了车辆赔付水平的简单判断标准。所以,当前中国几乎所有保险公司都采取这种定价方式。
但是,上述随车定价的方式,其风险识别并不精准。因为车辆事故的发生,不仅和车辆有关,显然还和司机直接相关。那么,如何有效地把司机因素纳入车辆保险风险指标体系中呢?
大家通常的习惯性想法是,以车辆特征维度+驾驶员特征维度。
然而,遗憾的是,把描述车辆画像的“出险次数”、“车型零整比”、“车辆使用年限”等3个特征维度,加上表达驾驶员画像的“交通违法记录”、“驾驶员年龄”、“驾驶员性别”等3个特征维度,简单扩充为一个6维线性特征空间,并不能更精准地判断风险。
这,如同早期人工智能学者常犯的毛病一样,误以为添加特征维度就一定能改善系统性能。
现实情况下,司机因素和车辆因素对于事故的影响,并不是两种特征标签简单的加法关系。比如,女司机驾驶手动挡汽车,往往手忙脚乱,事故率更高;年轻人开高级跑车,易激动,也会导致高事故率。不难发现,不同行为特征司机对于不同特征车辆的关于安全行驶的影响,是一种复合作用。其逻辑特征是乘法,即‘车辆画像’乘以‘驾驶员画像’得到‘车辆事故复合画像’,模型是:(“出险次数”+“车型零整比”+“车辆使用年限”)*(“交通违法记录”+“驾驶员年龄”+“驾驶员性别”)
同样道理,我们也可以把车辆行驶场景(行驶路线、行驶区域路况、行驶区域天气等)特征标签,作为另一个层次的特征,也纳入风险识别的复合因素:
为了更精确演算风险,还可以考虑更多的特征层次,比如执法部门处罚力度特征层、当地人文环境特征层等等,一层一层地纳入复合特征的高阶乘积:
熟悉深度学习算法的朋友可以看出,上图的特征乘积复合就是深度学习的张量模型。假设每一层的特征标签是3维的,则上图的多层流形结构等价于3的5次方维度张量。习惯传统思维的人喜欢把它看作243维特征值参数的线性空间,然而这种肤浅认识无法洞察加法逻辑表象背后更高层次的乘法(群)脉络。因为表达特征属性乘法的张量,一定内含群结构。
并且,更有意义的是,群作用与守恒量(即特征属性保持不变)之间存在一一对应关系。在某个确定风险属性下,上述模型的多重复合乘积的多层特征根域,一定有该特征根域的作用群,特征根域与作用群存在对偶空间关系。
类似于线性空间的对偶空间(aX+bY=c,其中c为常数,受加法条件制约的a、b与X、Y相互是对偶空间),如果(a+b)(X+Y)=c,其中c为常数,受乘法条件制约的a、b与X、Y相互是对偶空间。同样地,类似线性空间在加法条件下的对偶空间的波粒二象性,群乘法条件下的对偶空间也不能同时收缩,而是一方要素收缩则另一方要素膨胀,相当于某种形式下的反比关系。
即,互为对偶空间的两个空间,如果一个复杂则另一个必然简洁!
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-29 12:50
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社