|
14.4 对偶空间
上节我们说到,很多复杂问题要涉及到多层线性空间(流形),流形具备“矢量*旋量”结构,因此有完备解。但是旋量运算有时很困难,幸运的是,旋量变化(旋度算子)等同于其对偶空间的矢量变化(梯度算子)。换句话说,旋量变化运算可以转化为矢量变化运算,矢量大小变化常常要容易计算得多。毕竟,梯度算子在深度学习大家早已滚瓜烂熟。问题是,这里的“对偶空间”又是个什么鬼东西呢?
硬邦邦的数学定义是这样说的:在数学里,任何向量空间V都有其对应的对偶空间V*。对偶空间V*由向量空间V的线性泛函组成。对偶空间V*具有向量加法及标量乘法,是线性空间。对偶空间V*和向量空间V共同组成了双线性结构。
什么叫线性泛函?什么叫双线性结构?非数学系的学生看到这种非人话的专业术语,估计云里雾里犯迷糊,失去继续探究的勇气。其实对偶空间的概念并不那么高深。下面部分引用了网友matongxue314的帖子,简单形象化探讨一下“对偶空间”的神奇:
设直线方程:ax+by=c
上面是把a、b为直线斜率,x、y 作为特征基(坐标轴X、Y)的投影值变量。
有好事者想,凭什么不能把a、b 作为特征基(坐标轴X、Y)的坐标变量,反之而把x、y看作直线斜率呢?(这其实就是‘对偶’观念)
这时,如果在直线 上固定一个点
,作图线
( 其中
是
点的
坐标,
是
点的
坐标):
注意,当 在
上沿直线滑动时,随着
变动,
和
的数值也随之变化,即
直线的斜率随之变动。这相当于,相对于X、Y坐标轴而言, 有对应的无数条
在旋转运动:
这就是张量上的旋度的意义:向量空间矢量变化等同于其对偶空间的旋量变化。
进一步看,如果我们把X、Y看作特征基、把x、y看作直线斜率,把a、b 作为特征基(坐标轴X、Y)的坐标变量,对应于一个双线性结构(直线 和直线
两个线性约束条件塑造)。这个双线性结构,相对于X、Y坐标轴而言,有一个是沿直线滑动(方向不变、大小变化)的矢量,对应一个是相对中心点旋转(方向变化、大小不变)的旋量。
并且,这个双线性结构,也可以看作是4个特征基(协变*逆变)的张量积空间,如7.3 多重线性关系章节探讨过的:
如果我们把上述直线 和直线
两个线性约束条件,看作是4个特征基(协变*逆变)的张量积空间,即分别把
中的x、y 作为特征基(X、Y)的投影,并且把
中的a、b 看作另一对特征基(α、β)的特征值,那么这个向量空间(α、β)正是向量空间(X,Y)的对偶空间:
在4个特征基的“向量空间*对偶空间”张量积空间,对于X、Y两特征基的旋转量,转换成4维度的线性量。
对偶空间V*由向量空间V的线性泛函组成,如果V是多维的情况也是一样的。
比如,当特征基为矢量时,向量空间V如下:
当V*的特征基为线性泛函时,
为
的对偶空间。V*如下:
几点补充说明:
1、如果f和x分别存在各自的多维度特征空间,则函数 f(x)=c 【c为常数】可以看作 f*x 张量积在约束条件c 下的流形。
2、矢量的特征(即矢量的方向)只能取单一值,而旋量相当于‘矢量方向开根号’的多特性值量。从逻辑学看,矢量特征即谓词,只能取单一值谓词的分析系统叫做一阶逻辑;而可取多值谓词的分析系统叫做高阶逻辑,这意味着旋量分析系统具有高阶逻辑特征。
3、如果矢量方向变化的微分计算复杂,可以看作其对偶空间的旋量,以旋转群来处理之。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-3-13 00:32
Powered by ScienceNet.cn
Copyright © 2007-2025 中国科学报社