博文

关于不完备性定理和不确定性原理的探讨（十四）（8）

已有 1688 次阅读 2019-6-8 16:35 |系统分类:科研笔记

14.8 特征相乘

下图是小学生应用题，要求5秒钟口算得出答案：

大家通常的习惯性算法是：

设狗、猫、兔分别为x、y、z公斤，有：

y+z=10

x+z=20

x+y=24

推出：x=17，y=7，z=3

所以：x+y+z=17+7+3=27

但是，上述演算显然满足不了5秒钟口算的要求。

如果学生有较强的洞察力，就能一目了然、看透外表、直达本质，发现第一、二、三张图相加，刚好是第四张图里面动物的两倍。简单心算（10+20+24）/ 2 = 27 ,立马得到准确答案。

本题简算有效，有两个要点，一是无需求出狗、猫、兔的分别重量，只需笼统合计数即可；二是引入了乘除法运算，升级了加法代数。

洞察逻辑表象背后更高层次的脉络，对于当前似乎陷入寒冬的人工智能领域，有着特别的启发意义。

前几年轰动一时的深度学习，更广泛应用好像遇到某种瓶颈。那么，AI三要素：数据、计算力、算法，谁是拖累发展后劲的罪魁祸首呢？

首先，数据量不是瓶颈。随着社会各行各业拥抱数字化，以及廉价云服务的普及，进一步推动了大数据爆发。据说现今最近一个年度内产生的新数据，就相当于人类诞生以来1万年至两年之前的所有数据量总和。

其次，计算力不是瓶颈。OpenAI调查表明AI计算力提升远超摩尔定理限制，目前AI计算力已经实现3.5个月翻一番，从2012年谷歌大脑到2017年alphaGo深度学习计算力提升了30万倍，而且GPU和TPU芯片还在加速这种趋势。

很显然，AI发展的瓶颈在于算法。而解决AI算法瓶颈，亟待传统理论的突破。很多学者都发现，自从量子力学和相对论诞生以后，自然科学基础理论似乎陷入了极其严重的漩涡，无法自拔。量子理学以上帝投骰子为原理，相对论时间变短尺度变长，如此解读难道不荒谬吗？

究其根本，这种荒谬的根本原因在于，我们习惯于以沿用了两千年的公理系统框架来解读自然科学。公理系统的理论框架是线性空间，而线性空间参照系的特征基是向量，向量只表达一阶特征属性，所以线性空间（向量空间）只能表达一阶逻辑的系统。而量子力学和相对论是高阶逻辑的，高阶逻辑系统的特征属性具有高阶特征。

所谓高阶特征，也就是特征与特征的复合作用，即特征属性与特征属性的乘积。在一阶逻辑系统中，特征属性是一个一个维度加出来的，比如n维特征空间、扩展到n+1维特征空间、再扩展到n+2维特征空间。一阶逻辑系统中，特征属性只能相加，不能相乘。一阶逻辑系统中，不能出现“桌子乘以椅子”、“司机乘以车辆”、“人品属性乘以借贷属性”等等多重特征的复合谓词。高阶复合特征属性，对于一阶逻辑是无意义的。然而，高阶复合特征属性（特征相乘）却往往隐藏着更高层次的逻辑脉络，意味着更高层次的洞察力演算。类似算术乘法相比算术加法是更高层次的演算，群论（群生成元的乘法）有时比线性空间（特征基的加法）更具优势。

下面，以一个简单例子来说明深度学习模型中的复合特征（特征相乘）的乘法算法的重大意义：

保险公司本质是经营风险，为了屏蔽高风险业务，保险业制定了依据车辆出险频率收费的策略。上年出险次数多的车辆需要缴纳高额保险费，反之出险次数越少优惠折扣越大。显然，“出险次数”是车辆保险筛选客户的重要指标。

为了更准确判断车辆赔付风险，保险公司还把不同车型的“车型零整比”作为另一个特征标签。

另外，有的保险公司也把“车辆使用年限”作为车辆风险特征属性的第3个关键维度。

以“出险次数”、“车型零整比”、“车辆使用年限”等3个特征维度，在一定程度上提供了车辆赔付水平的简单判断标准。所以，当前中国几乎所有保险公司都采取这种定价方式。

但是，上述随车定价的方式，其风险识别并不精准。因为车辆事故的发生，不仅和车辆有关，显然还和司机直接相关。那么，如何有效地把司机因素纳入车辆保险风险指标体系中呢？

大家通常的习惯性想法是，以车辆特征维度+驾驶员特征维度。

然而，遗憾的是，把描述车辆画像的“出险次数”、“车型零整比”、“车辆使用年限”等3个特征维度，加上表达驾驶员画像的“交通违法记录”、“驾驶员年龄”、“驾驶员性别”等3个特征维度，简单扩充为一个6维线性特征空间，并不能更精准地判断风险。

这，如同早期人工智能学者常犯的毛病一样，误以为添加特征维度就一定能改善系统性能。

现实情况下，司机因素和车辆因素对于事故的影响，并不是两种特征标签简单的加法关系。比如，女司机驾驶手动挡汽车，往往手忙脚乱，事故率更高；年轻人开高级跑车，易激动，也会导致高事故率。不难发现，不同行为特征司机对于不同特征车辆的关于安全行驶的影响，是一种复合作用。其逻辑特征是乘法，即‘车辆画像’乘以‘驾驶员画像’得到‘车辆事故复合画像’，模型是：（“出险次数”+“车型零整比”+“车辆使用年限”）*（“交通违法记录”+“驾驶员年龄”+“驾驶员性别”）

同样道理，我们也可以把车辆行驶场景（行驶路线、行驶区域路况、行驶区域天气等）特征标签，作为另一个层次的特征，也纳入风险识别的复合因素：

为了更精确演算风险，还可以考虑更多的特征层次，比如执法部门处罚力度特征层、当地人文环境特征层等等，一层一层地纳入复合特征的高阶乘积：

熟悉深度学习算法的朋友可以看出，上图的特征乘积复合就是深度学习的张量模型。假设每一层的特征标签是3维的，则上图的多层流形结构等价于3的5次方维度张量。习惯传统思维的人喜欢把它看作243维特征值参数的线性空间，然而这种肤浅认识无法洞察加法逻辑表象背后更高层次的乘法（群）脉络。因为表达特征属性乘法的张量，一定内含群结构。

并且，更有意义的是，群作用与守恒量（即特征属性保持不变）之间存在一一对应关系。在某个确定风险属性下，上述模型的多重复合乘积的多层特征根域，一定有该特征根域的作用群，特征根域与作用群存在对偶空间关系。

类似于线性空间的对偶空间（aX+bY=c,其中c为常数，受加法条件制约的a、b与X、Y相互是对偶空间），如果（a+b）（X+Y）=c,其中c为常数，受乘法条件制约的a、b与X、Y相互是对偶空间。同样地，类似线性空间在加法条件下的对偶空间的波粒二象性，群乘法条件下的对偶空间也不能同时收缩，而是一方要素收缩则另一方要素膨胀，相当于某种形式下的反比关系。

即，互为对偶空间的两个空间，如果一个复杂则另一个必然简洁！

转载本文请联系原作者获取授权，同时请注明本文来自陈正茂科学网博客。
链接地址：https://blog.sciencenet.cn/blog-1666470-1183802.html

上一篇：关于不完备性定理和不确定性原理的探讨（十四）（7）
下一篇：关于不完备性定理和不确定性原理的探讨（十四）（9）

收藏 IP: 175.191.123.*| 热度|

当前推荐数：1 推荐人：王安良

该博文允许注册用户评论请点击登录评论 (0 个评论)

数据加载中...

返回顶部

陈正茂

扫一扫，分享此博文

etreeasky的个人博客分享 http://blog.sciencenet.cn/u/etreeasky

博文

关于不完备性定理和不确定性原理的探讨（十四）（8）

当前推荐数：1 推荐人：王安良

该博文允许注册用户评论请点击登录评论 (0 个评论)

陈正茂

全部作者的其他最新博文

全部精选博文导读

相关博文

etreeasky的个人博客分享 http://blog.sciencenet.cn/u/etreeasky

博文

关于不完备性定理和不确定性原理的探讨（十四）（8）

当前推荐数：1 推荐人： 王安良

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

陈正茂

全部作者的其他最新博文

全部精选博文导读

相关博文

当前推荐数：1 推荐人：王安良

该博文允许注册用户评论请点击登录评论 (0 个评论)