||
「线性转换」是线性代数的核心概念,但是它的基本思想却很简单,我们甚至在小学就已经见过了。举例来说:
(1) $2 × 3 = 1 × 6$
意思是,3 个 2 等于 6 个1。换成我们上篇笔记的术语就是,将以 2 为基数的 3 转换为以 1 为基数的 6;换成线性代数的标准术语就是:设 $S$ 是一维向量空间且 $3 \in S$,设 $A$ 是 $1 × 1$ 矩阵,则其线性算子可定义为映射关系 $f: S \rightarrow S$,使得 $f(s) = As [s=3, A=2] = 6$。
这里可以看出,对 $2 × 3 = 1 × 6$ 这个事实,用不同的语言表述得到的「观感」的完全不同的。「3 个 2 等于 6 个1」是一句人人都懂的「俗语」,是用来对小学生说的;「以 2 为基数的 3 转换为以 1 为基数的 6」,要完全懂得就需要一点背景知识,亦即,你需要知道我的笔记《从零开始学习线性代数:维度、基、向量、矩阵和向量空间》的内容。而「线性代数的标准术语」大概就不是人人都懂的了,至少需要一个学期的线性代数课程的修习。不过就算你修了课,成绩也及格了,可能还是未必会将这个小学的算术等式与高精尖的线性转换联系起来,这就是我在《对线性代数教育的一点反思》中引用法国数学家迪厄多内的一段话,为了强调,这里再次抄录如下:
很难再有比线性代数更基础的理论了,而历代的数学教师和教科书作者却一直在用令人费解的矩阵计算把这种简单性掩盖了。
所以,线性代数难懂不是学习者的问题,而是关乎「我们学习数学实际上是在学什么」的大问题。不过这里不是谈论这个问题的地方,我们的关注点是线性转换的基本思想。在前两篇《从零开始学习线性代数》中我们初步谈到了线性转换,并给出了二维线性空间线性转换的基本公式,现再次抄录如下:
(2) $f(ax + by) = af(x) + bf(x)$
下面我们就从上面的算术等式出发,进一步探讨线性转换背后的基本思想。
为了和线性代数的标准公式保持一致,我们用大写字母 $A$ 表示基 (basis)(有些教科书称作「基底」)意思是「数数的单位」,用 $v$ 表示向量,用 $c$ 表示 $v$ 在各个维度上的标量,因此 $c$ 也是一个向量:
(3) $v = A\cdot c$
把这个等式写成函数形式:
(4) $f(c) = A\cdot c$
「线性转换」在我们日常生活中很常见,例如度量衡转换。假定我们这里将长度的度量从厘米转换为毫米,
(5) $1_{cm} = 10_{mm}$
这时,我们有两个向量空间,$cm$ 向量空间和 $mm$ 向量空间。两个空间之间的对应关系实际上是一种【映射】(mapping),$f: cm \rightarrow mm$。两个空间最大的区别就在于基的不同。如果从 $cm$ 空间的角度看,本空间的基是 $1_{cm}$,而 $mm$ 空间的基是 $0.1_{cm}$;从 $mm$ 的角度看,本空间的基是 $1_{mm}$,而 $cm$ 空间的基是 $10_{mm}$。这样,从 $cm$ 空间向 $mm$ 空间转换的基本公式就是
(6) $f(1_{cm}) = 10_{mm}$
设$a$ 是 $cm$ 空间的任意向量,则一般的转换公式就是
(7) $f(a \cdot 1_{cm}) = a \cdot f(1_{cm}) = a \cdot 10_{mm}$
这里最有意思的是,与一般的、抽象的实数向量空间不同,度量衡空间的基是具名的,这个「名」就是度量衡本身的名称,$cm$ 和 $mm$。这就像我们第一篇笔记中用西红柿和鸡蛋作「度量衡」一样。
可以看出,线性转换公式的两个特点:第一、线性转换的本质是基转换;第二、标量在转换前后维持不变,因此,给定一个变项 $ax$,我们通过基转换把 $x$ 转换为 $f(x)$,获得新的向量。比较公式 (7) 和公式 (2),唯一的区别是,(7) 只有一个变量,也是最简单的线性组合,$ax$,不过从严格的意义上,这种「线性组合」只有「线性」没有「组合」,因为「组合」的意义在于不同维度的量的加法。
以上讨论的是线性转换最简单的情况,一维数轴上的转换,例子是长度度量衡的转换。这种转换的实质是对给定向量值的线性放大或缩小,而长度本身并没有发生变化,因为无论是 $5cm$ 还是 $50mm$,长度是相同的。但如果脱离了度量衡转换这个语境,变成抽象的 $f(ax) = a(fx)$,$f(x) =10x$,那么,这个转换公式的的确确是把给定的一维向量放大了 10 倍。
有了一维向量算术的基础,再来讨论二维空间的线性组合就非常容易了。
线性代数中最常见的线性组合是二维的、由两个基数—— $x$ 轴上的基数 和 $y$ 轴上的基数 —— 构成,同时,以这两个基数为基础,在两个维度上计数就有两个标量 a 和 b,因此这两个维度上的最简单的线性组合就是 $ax$ 和 $by$。我们可以通过向量加法形成新的、维度增加的线性组合:$ax + by$,亦即,如果 $ax$ 和 $by$ 是 $n-1$ 维,那么 $ax + by$ 则是 n 维。
如果仍然拿度量衡转换作例子的话,二维意味着我们的度量对象不再是长度而是面积,或者更确切地说是平面的规格。所谓规格,例如同样面积是12平米的房间,可能是 4米 × 3米,也可能是 3米 × 4米,还有可能是 6米 × 2米,所以我们在买房时除了看房屋大小的面积,可能还要关心其规格,假定开发商承诺房屋朝南一面是 4米,有三个窗,但是在交钥匙是发现朝南一面是 3米,只有两个窗,虽然总面积没变,但你是不是不满意的感觉?这就是规格的作用。因此,对平面的度量有两种方法,向量法,就是规格,例如 $(4,3)$ 代表 $4 × 3$;标量法,就是一个数,例如 $12$。向量空间中对量的度量比买房子要复杂,度量的单位是矩阵,度量的大小是向量,度量的面积是标量,除此之外还可以度量向量之间的角度,也是一个标量。
假定我们的度量衡转换是将矩形的规格从 $cm$ 转换成 $mm$,那么首先应确定的是,矩形的规格表示是一个二维向量;假定长为 $a$、宽为 $b$,则规格表示为 $(a, b)$。而作为向量的基,则是单位矩阵 $\begin{bmatrix}1&0\\0&1\end{bmatrix}$。这个矩阵的几何意义是,平面直角坐标系上的单位正方形,其规格用两个基向量 $\hat i_{cm} = \begin{bmatrix}1\\0 \end{bmatrix}$ 和 $\hat j_{cm} = \begin{bmatrix}0\\1 \end{bmatrix}$ 所代表的边表示。这样,以cm为度量衡的矩形用线性代数的标准公式表示就是:
(8)
$\begin{bmatrix}1_{cm}&0\\0&1_{cm} \end{bmatrix} \cdot \begin{bmatrix}a\\b \end{bmatrix} = \begin{bmatrix} a_{cm}\\b_{cm} \end{bmatrix}$
进行度量衡转换,实际上就是把基向量 $\hat i_{cm}$ 和 $\hat j_{cm}$ 转换成 $f(\hat i_{cm})$ 和 $f(\hat i_{cm})$
(9)
$f(\hat i_{cm}) = 10 \cdot \begin{bmatrix}1\\0 \end{bmatrix} = \begin{bmatrix}10\\0 \end{bmatrix}$
$f(\hat j_{cm}) = 10 \cdot \begin{bmatrix}0\\1 \end{bmatrix} = \begin{bmatrix}0\\10 \end{bmatrix}$
所以,将矩形规格从 $cm$ 转换成 $mm$ 的转换公式就是
(10)
$f(a_{cm}+b_{cm}) = af(a_{cm}) + bf(b_{cm}) = a \cdot \begin{bmatrix} 10\\0 \end{bmatrix} + b \cdot \begin{bmatrix} 0\\10 \end{bmatrix} = \begin{bmatrix} 10a\\10b \end{bmatrix}$
综上所述,二维平面量的转换要比一维数轴上的量的转换复杂,这个复杂度源于维度的增加,如果是数轴直线的量,我们只考虑一个基数和规模,而平面的量,我们既要分别考虑也要综合考虑两个维度的基数和规模。此时的基数不再是单纯的数,而是表示两个维度的基数的矩阵,而规模则由单纯的数变成向量——代表每个维度的规模。但是,一维直线上数的转换和二维平面上的向量的转换,原理上都一样,都是 $v = Ac$,由 c 得到 v,但是二维平面或二维以上的空间的基数 $A$ 变成矩阵,规模 c
变成向量,这使得表示方式变得复杂。从几何的角度看,一维数轴上量的基数表示是单位线段,而二维平面上量的基数表示是单位平行四边形。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-19 18:25
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社