etreeasky的个人博客分享 http://blog.sciencenet.cn/u/etreeasky

博文

关于不完备性定理和不确定性原理的探讨(十四)(8)

已有 1688 次阅读 2019-6-8 16:35 |系统分类:科研笔记

 14.8 特征相乘


    下图是小学生应用题,要求5秒钟口算得出答案:

1.jpg

    大家通常的习惯性算法是:

    设狗、猫、兔分别为x、y、z公斤,有:

    y+z=10

    x+z=20

    x+y=24

    推出:x=17,y=7,z=3

    所以:x+y+z=17+7+3=27

   

    但是,上述演算显然满足不了5秒钟口算的要求。



   如果学生有较强的洞察力,就能一目了然、看透外表、直达本质,发现第一、二、三张图相加,刚好是第四张图里面动物的两倍。简单心算(10+20+24)/ 2 = 27 ,立马得到准确答案。

   本题简算有效,有两个要点,一是无需求出狗、猫、兔的分别重量,只需笼统合计数即可;二是引入了乘除法运算,升级了加法代数。




   洞察逻辑表象背后更高层次的脉络,对于当前似乎陷入寒冬的人工智能领域,有着特别的启发意义。

   前几年轰动一时的深度学习,更广泛应用好像遇到某种瓶颈。那么,AI三要素:数据、计算力、算法,谁是拖累发展后劲的罪魁祸首呢?

   首先,数据量不是瓶颈。随着社会各行各业拥抱数字化,以及廉价云服务的普及,进一步推动了大数据爆发。据说现今最近一个年度内产生的新数据,就相当于人类诞生以来1万年至两年之前的所有数据量总和。

   其次,计算力不是瓶颈。OpenAI调查表明AI计算力提升远超摩尔定理限制,目前AI计算力已经实现3.5个月翻一番,从2012年谷歌大脑到2017年alphaGo深度学习计算力提升了30万倍,而且GPU和TPU芯片还在加速这种趋势。

   很显然,AI发展的瓶颈在于算法。而解决AI算法瓶颈,亟待传统理论的突破。很多学者都发现,自从量子力学和相对论诞生以后,自然科学基础理论似乎陷入了极其严重的漩涡,无法自拔。量子理学以上帝投骰子为原理,相对论时间变短尺度变长,如此解读难道不荒谬吗?



   究其根本,这种荒谬的根本原因在于,我们习惯于以沿用了两千年的公理系统框架来解读自然科学。公理系统的理论框架是线性空间,而线性空间参照系的特征基是向量,向量只表达一阶特征属性,所以线性空间(向量空间)只能表达一阶逻辑的系统。量子力学和相对论是高阶逻辑的,高阶逻辑系统的特征属性具有高阶特征。

   所谓高阶特征,也就是特征与特征的复合作用,即特征属性与特征属性的乘积。在一阶逻辑系统中,特征属性是一个一个维度加出来的,比如n维特征空间、扩展到n+1维特征空间、再扩展到n+2维特征空间一阶逻辑系统中,特征属性只能相加,不能相乘。一阶逻辑系统中,不能出现“桌子乘以椅子”、“司机乘以车辆”、“人品属性乘以借贷属性”等等多重特征的复合谓词。高阶复合特征属性,对于一阶逻辑是无意义的。然而,高阶复合特征属性(特征相乘)却往往隐藏着更高层次的逻辑脉络,意味着更高层次的洞察力演算。类似算术乘法相比算术加法是更高层次的演算,群论(群生成元的乘法)有时比线性空间(特征基的加法)更具优势。


   下面,以一个简单例子来说明深度学习模型中的复合特征(特征相乘)的乘法算法的重大意义:

   保险公司本质是经营风险,为了屏蔽高风险业务,保险业制定了依据车辆出险频率收费的策略。上年出险次数多的车辆需要缴纳高额保险费,反之出险次数越少优惠折扣越大。显然,“出险次数”是车辆保险筛选客户的重要指标。

    为了更准确判断车辆赔付风险,保险公司还把不同车型的“车型零整比”作为另一个特征标签。

    另外,有的保险公司也把“车辆使用年限”作为车辆风险特征属性的第3个关键维度。

    以“出险次数”、车型零整比”“车辆使用年限”等3个特征维度,在一定程度上提供了车辆赔付水平的简单判断标准。所以,当前中国几乎所有保险公司都采取这种定价方式。


    但是,上述随车定价的方式,其风险识别并不精准。因为车辆事故的发生,不仅和车辆有关,显然还和司机直接相关。那么,如何有效地把司机因素纳入车辆保险风险指标体系中呢?

21.jpg

   大家通常的习惯性想法是,以车辆特征维度+驾驶员特征维度。

     然而,遗憾的是,把描述车辆画像的“出险次数”、“车型零整比”“车辆使用年限”等3个特征维度,加上表达驾驶员画像的“交通违法记录”、“驾驶员年龄”、“驾驶员性别”等3个特征维度,简单扩充为一个6维线性特征空间,并不能更精准地判断风险。

   这,如同早期人工智能学者常犯的毛病一样,误以为添加特征维度就一定能改善系统性能。

174853cssrrsbbo7o7766y.png

 104455od18zm54wg8o7c44.png

   现实情况下,司机因素和车辆因素对于事故的影响,并不是两种特征标签简单的加法关系。比如,女司机驾驶手动挡汽车,往往手忙脚乱,事故率更高;年轻人开高级跑车,易激动,也会导致高事故率。不难发现,不同行为特征司机对于不同特征车辆的关于安全行驶的影响,是一种复合作用。其逻辑特征是乘法,即‘车辆画像’乘以驾驶员画像’得到‘车辆事故复合画像,模型是:(“出险次数”+“车型零整比”+“车辆使用年限”)*(“交通违法记录”+“驾驶员年龄”+“驾驶员性别”)





    同样道理,我们也可以把车辆行驶场景(行驶路线、行驶区域路况、行驶区域天气等)特征标签,作为另一个层次的特征,也纳入风险识别的复合因素:

     4.jpg


     为了更精确演算风险,还可以考虑更多的特征层次,比如执法部门处罚力度特征层、当地人文环境特征层等等,一层一层地纳入复合特征的高阶乘积:

5.jpg

10.jpg                            12.jpg

    熟悉深度学习算法的朋友可以看出,上图的特征乘积复合就是深度学习的张量模型。假设每一层的特征标签是3维的,则上图的多层流形结构等价于3的5次方维度张量。习惯传统思维的人喜欢把它看作243维特征值参数的线性空间,然而这种肤浅认识无法洞察加法逻辑表象背后更高层次的乘法(群)脉络。因为表达特征属性乘法的张量,一定内含群结构。



   并且,更有意义的是,群作用与守恒量(即特征属性保持不变之间存在一一对应关系。在某个确定风险属性下,上述模型的多重复合乘积的多层特征根域,一定有该特征根域的作用群,特征根域与作用群存在对偶空间关系。

   类似于线性空间的对偶空间(aX+bY=c,其中c为常数,受加法条件制约的a、b与X、Y相互是对偶空间),如果(a+b)(X+Y)=c,其中c为常数,受乘法条件制约的a、b与X、Y相互是对偶空间。同样地,类似线性空间在加法条件下的对偶空间的波粒二象性,群乘法条件下的对偶空间也不能同时收缩,而是一方要素收缩则另一方要素膨胀,相当于某种形式下的反比关系。

   即,互为对偶空间的两个空间,如果一个复杂则另一个必然简洁!



https://blog.sciencenet.cn/blog-1666470-1183802.html

上一篇:关于不完备性定理和不确定性原理的探讨(十四)(7)
下一篇:关于不完备性定理和不确定性原理的探讨(十四)(9)
收藏 IP: 175.191.123.*| 热度|

1 王安良

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-19 12:52

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部