||
10.9 多重子结构
按照上一节的分析,“深度学习”模式实施过程大致如下(以股市预测为例):
一大堆原始数据(拟投资企业的所有相关数据)-->首先找到数据间的线性关系(在企业报表中找哪些科目是成本类的基础科目、哪些是相关科目、脉络关系如何)-->然后把某一层次的线性特征作为某个抽象概念的“偏线性”特征(比如,制作一个成本类相关数据的线性空间)-->再与另外层次的特征线性空间外积成张量模型的某抽象概念(比如,成本类线性空间矩阵与销售类线性空间矩阵相乘)-->检验此抽象概念和实际对象的误差(计算收益率数据与实际数据对比误差)-->不断外积另外层次的特征线性空间(比如,重积上下游情况矩阵、同行情况矩阵、市场潜力矩阵、兴衰周期矩阵等等)-->直至此抽象概念和实际对象的误差至可容范围内(达到准确预知股指走势)
如果人工智能每次股指预测都非常准确,呵呵呵,那不是发财了,财富滚滚而而来挡都挡不住,想来睡着了都要笑醒哈哈。
“人工智能”炒股完胜之日,料想其它复杂系综问题也必能迎刃而解。
理论而言,那只需要通过一层又一层所涉线性矩阵的乘积,通过计算机(逐单元丁对丁卯对卯地)对每个矩阵元素叠乘演算。任何难题任何真理,因此当然能够得以完美地解决。
文明智慧的康庄大道近在眼前啊。
耳边又萦绕着希尔伯特先生的豪言壮语“Wir müssen wissen, wir werden wissen.”(我们必须知道,我们必将知道。)
是这样么?
也许,单层线性空间(一阶逻辑)的缺陷,因多重线性的张量可以克服。歌德而不完备性定理的瓶颈,因多重线性的张量可以突破。
不过遗憾的是,仅仅如此至少在实践中仍然是行不通的(即使纸上谈兵的理论可行)。
因为运算量过于巨大!
我们知道,多重无穷维矩阵的乘积,其运算量甚至可能达到阿列夫2之多。运算能力再强大的计算机都做不到。
更深一步来看,是不是可以这样思考:既然我们并不苛求绝对完备的数据、也不苛求完全准确的与现实完美绝对地匹配,也许可以舍弃一些不那么重要的数据,把有限的演算资源留给主要的问题,只取那些最重要的数据演算。这样不就可以减少运算量了吗?
可是因此真的行得通吗?
抓大放小的想法在线性方程中可能并不会有太大问题,因为线性方程的总数总是精确地等于各个部分的加和,一个微小的误差永远只是一个微小误差(或者最多以正比方式线性增长)。
不过非常遗憾的是,类似想法在张量模型中基本上是行不通的。因为张量中的变量不是一阶的一个变量x,而是二阶的两个变量xy乘积、或者三阶的三个变量xyz乘积、甚至n阶的n个变量乘积。在高阶变量乘积情况下,哪怕微不足道的不准确或者不完备,都有可能导致指数级非线性的巨大误差(蝴蝶效应)。将导致所谓诸如股市预测模型、天气预报模型等全然无用。
也就是说,除了偏线性的理论指导"深度学习",我们还需要另外的诀窍来补充。
“深度学习”人工智能模型的关键困难是如何有效简化演算。 这也许还是应该回到张量模型研究相对深入的量子力学和相对论中,寻找方案。
当年爱因斯坦思考相对论时,出发点是因为经典力学只能通过静止(或匀速)参照系表达,而无法解答相对运动的多个非运势参照系的系综中的问题。换句话说,爱因斯坦发现经典力学所依赖的单一参照系(向量空间),无法解答更复杂的多参照系问题,所以他才咬牙花了8年光阴苦练张量神剑。因为一个向量空间只能有一个参照系,但一个张量空间可以包含不同的偏线性子参照系。
由于基本线性结构类似,初学者容易混淆向量和张量的概念,特别是在有限维的情况下。
在有限维的情况下,张量空间的数学定义一般是这样的:
(φ+ψ)(x) =φ(x)+ψ(x)
(aφ)(x)=aφ(x)
上式可以化成下面的一个式子:
(φ+ψ)(ax+by) =aφ(x)+aψ(x)+bφ(y)+bψ(y)
初学者容易混淆:如果把φ(x)、ψ(x)、φ(y)、ψ(y)各看成基矢量,这不就是一个向量空间吗?
其实不然。因为向量空间(平面矩阵)是单层次线性空间,逻辑结构图如下:
而(φ+ψ)(ax+by)构造的是双线性映射(二重线性映射)。
并且,我们还可以构造更复杂的三重线性映射:(F+g)(φ+ψ)(ax+by)
这是更高阶张量,其链接线条的逻辑结构比单层次的向量空间要复杂得多:
请注意,“(F+g)(φ+ψ)(ax+by) ”的三重线性映射结构,包含了多重子线性结构 ,分别是(F+g)、(φ+ψ)和(ax+by),它们分别表达了三个不同的偏线性空间。(F+g)是一个线性空间,(φ+ψ)是另一个线性参照系,(ax+by)又是另外一个参照系。
我们关心的问题是,有没有一种更高层次的统一参照系,能同时包含表达各种子结构系统呢?
一般而言,“系统”可看作“集合”+“结构”。 当一个系综(张量)由多个系统而成时,则这个集合由多个‘子集合’组成,同时包含了多个‘子结构’。
比如,一个细胞看作细胞核、核糖体、细胞质、内质网、高尔基体、囊泡、溶酶体、线粒体、细胞骨架、细胞膜、中心粒等等子集合;同时放大镜下,细胞中包含了不同子结构,这些子结构各不相同。
有时候,不同子结构需要不同的子参照系,以各自不同的特色方式表达。
如果对这些子结构我们以同一统一参照系结构来度量,有时并不一定适合。因为如果取的参照系不合适,描述方式可能会非常复杂。
比如,在地心学说时代,占星家以地球为原点,也能够制作准确的火星轨道图(只不过有点复杂),见下图:
到了日心学的时代,如果我们一太阳为参照系原点,则火星轨道图要简单得多:
进一步,如果我们把太阳系作为整个银河系的子系统,则火星轨道是一种简洁的螺旋前进的轨迹。选取合适的子参照系,行星轨迹在整个银河系中的运行也一目了然的清晰:
选择合适的参照系,能使问题描述变得清晰简单。同样道理,选择子参照系共同组成大系综的合适的整体参照系,也能减化问题,大大有易于复杂张量系统的演算。
那么,有没有这样的普遍适用的大统一参照系呢?
exp(ipr)就是这种张量多重子结构多层次子参照系的典型代表(连续无穷维微分几何嵌套着旋量子结构)。
前面说过,虚数i本质是单位周期结构最基本形式: 如果我们计算i、i平方、i三次方、i四次方、i五次方、i六次方、i七次方、i八次方......,结果是i、-1、-i、1、i、-1、-i、1.... 即,i、-1、-i、1的周而复始的循环。
带虚数i的复数则意味着一维旋量子结构,而带有虚数i的exp(ipr)复指数,则可看作螺旋前进的结构体。由于这种层层递进的螺旋体是具有普遍意义的广泛存在,因此exp(ipr)有特殊意义,因此它成为所有线性时不变系统的共同本征函数系,是卷积定理化繁为简的根本。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-24 08:38
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社