LOADING

加载过慢请开启缓存 浏览器默认开启

矩阵论:欧式空间与线性变换介绍

欧式空间与线性变换介绍

欧式(Euclid)空间作为一种特殊的线性空间,我们先引入线性空间的概念。

定义 1: 线性空间

\(V\) 是一个非空集合,它的元素用 \(x, y, z\) 等表示,称为向量;\(K\) 是一个数域,它的元素用 \(k, l, m\) 表示,如果 \(V\) 满足以下条件:

  1. \(V\) 中定义一个加法运算,即当 \(x,y\in V\) 时,有唯一的和 \(x + y\in V\),且满足以下性质:
    • 结合律: \(x + (y + z) = (x + y) + z\);
    • 交换律: \(x + y = y + x\);
    • 零元素存在性: \(\exists 0, s.t. x + 0 = x\);
    • 负元素存在性: \(\forall x\in V,\exists y\in V, s.t.x + y = 0\),记 \(y = -x\);
  2. \(V\) 中定义数乘运算,即当 \(x\in V,k \in K\) 时,有唯一的乘积 \(kx\in V\),且满足以下性质:
    • 因子分配律: \(k(x+y) = kx + ky\);
    • 分配律: \((k+l)x = kx + lx\);
    • 结合律: \(k(lx) = (kl)x\);
    • 中性元: \(1 x = x\);

则称 \(V\) 是数域 \(K\) 上的线性空间。

定义中的 8 条性质非常重要。如果对于数域 \(K\),向量空间 \(V\),设加群 \((V, +)\)\(+\)\(V\) 上满足交换律的运算),不难验证其满足群的定义。定义 \(K \times V \rightarrow V: (k, \alpha) \rightarrow k\alpha\)(即 \(V\) 上的数乘运算),可以验证 \(V\) 是一个 \(K\)-模。即,线性空间是一类特殊的模。

为借助数量运算以实现向量的运算,还要引入向量的坐标。

定义 2: 线性空间的基

\(V\) 是数域 \(K\) 上的线性空间,\(x_1,x_2,\cdots,x_r\in V\),如果它满足:

  1. \(x_1,x_2,\cdots,x_r\) 线性无关;
  2. \(\forall x \in V\) 都是 \(x_1,x_2,\cdots,x_r\) 的线性组合;

则称 \(x_1,x_2,\cdots,x_r\)\(V\) 的一个 ,称 \(x_i(i=1,2,\cdots,r)\)基向量

定义 3: 坐标系

称线性空间 \(V^n\) 上的一个基 \(x_1, x_2, \cdots, x_n\)\(V^n\) 的一个 坐标系。设向量 \(x \in V^n\),它在该基下的线性表示式为

\[ x = \xi_1x_1 + \xi_2x_2 + \cdots + \xi_nx_n \]

则称 \(\xi_1,\xi_2,\cdots,\xi_n\)\(x\) 在该基下的 坐标分量,记为

\[ (\xi_1,\xi_2,\cdots,\xi_n)^\top \]

显然,线性空间 \(V^n\) 存在多个不同的基,对应多个不同的坐标系,我们希望研究当基改变时,向量的坐标如何改变。

基变换

首先介绍 基变换,即 \(V^n\) 的一个基 \(\boldsymbol{X} = ( \boldsymbol{x}_1, \boldsymbol{x}_2, \cdots, \boldsymbol{x}_n)\) 变为另一个基 \(\boldsymbol{Y} = ( \boldsymbol{y}_1, \boldsymbol{y}_2, \cdots, \boldsymbol{y}_n)\)

由基的定义可知:

\[ \boldsymbol{y}_i = c_{1i} \boldsymbol{x}_1 + c_{2i} \boldsymbol{x}_2 + \cdots + c_{1n} \boldsymbol{x}_n(i = 1,2,\cdots,n) \]

上式可以写成矩阵乘法形式:

\[ ( \boldsymbol{y}_1, \boldsymbol{y}_2, \cdots, \boldsymbol{y}_n) = ( \boldsymbol{x}_1, \boldsymbol{x}_2, \cdots, \boldsymbol{x}_n) \boldsymbol{C} \tag{2.5.1} \]

其中矩阵

\[ \boldsymbol{C} = \begin{bmatrix} c_{11} & c_{12} & \cdots & c_{1n}\\ c_{21} & c_{22} & \cdots & c_{2n}\\ \vdots & \vdots & & \vdots\\ c_{n1} & c_{n2} & \cdots & c_{nn} \end{bmatrix} \]

称为基变换的 过渡矩阵,式 (2.5.1) 称为 基变换公式

显然,过渡矩阵是可逆矩阵,因为新基能变换为旧基。

内积与欧式空间

在线性空间中,向量的基本运算仅为线性运算。例如,在熟悉的二维或三维向量空间中,我们发现向量的模长、向量间的夹角等度量概念未能被线性空间直接表达。因此,我们引入内积内积空间的概念。

内积的定义

定义
\(V\) 是实数域 \(\mathbb{R}\) 上的线性空间,若对 \(\forall x,y \in V\),按照某种规则定义一个实数 \((x,y)\),满足以下条件:

  1. 交换律\((x,y) = (y,x)\)
  2. 分配律\((x,y+z) = (x,y) + (x,z)\)
  3. 齐次性\((kx,y) = k(x,y) = (x,ky), \forall k\in \mathbb{R}\)
  4. 非负性\((x,x) \geq 0\),且 \((x,x) = 0 \iff x = 0\)

则称 \((x,y)\) 为向量 \(x,y\)内积,称 \(V\)欧式空间(Euclidean Space)。

内积的性质

内积具有以下基本性质:

  • \(( \boldsymbol{x}, k \boldsymbol{y}) = k( \boldsymbol{x}, \boldsymbol{y})\)
  • \(( \boldsymbol{x}, \boldsymbol{0}) = 0\)

向量的模长

在欧式空间中,我们可以定义向量的长度(模、范数)如下:

定义
在欧式空间 \(V\) 中,非负实数
\[ \left| \boldsymbol{x} \right| = \sqrt{( \boldsymbol{x}, \boldsymbol{x})} \]
称为向量 \(\boldsymbol{x}\)长度(或 2-范数,下一节将介绍)。

单位向量与单位化
在二维或三维向量空间中,通常选取 \((1,0,0)\) 等为坐标轴,这些长度为 \(1\) 的向量称为单位向量。如果 \(\boldsymbol{x} \neq 0\),可以通过单位化(规范化) 得到单位向量:
\[ \boldsymbol{x}_0 = \frac{\boldsymbol{x}}{\left| \boldsymbol{x} \right|} \]

向量夹角

在低维空间中,向量的夹角概念较直观。为了在欧式空间中定义向量夹角,我们利用 Cauchy–Schwarz 不等式
\[ \left| \frac{( \boldsymbol{x}, \boldsymbol{y})}{\left| \boldsymbol{x}\right|\left| \boldsymbol{y}\right|} \right| \leq 1 \]
进而定义两个非零向量 \(\boldsymbol{x}\)\(\boldsymbol{y}\) 的夹角 \(\left\langle \boldsymbol{x}, \boldsymbol{y} \right\rangle\)余弦值
\[ \cos \left\langle \boldsymbol{x}, \boldsymbol{y} \right\rangle = \frac{( \boldsymbol{x}, \boldsymbol{y})}{\left| \boldsymbol{x} \right| \left| \boldsymbol{y} \right|} \]

向量正交

定义
若欧式空间中的两个向量 \(\boldsymbol{x}\)\(\boldsymbol{y}\) 满足:
\[ (x,y) = 0 \]
则称它们正交(垂直)

定理
在欧式空间中,若向量组 \(\{x_1, x_2, \dots, x_n\}\) 互相正交,则它们必然线性无关。

正交基与标准正交基

定义
在欧式空间 \(V^n\) 中,由 \(n\) 个非零向量组成的正交向量组称为 \(V^n\)正交基。若正交基中的向量均为单位向量,则称为标准正交基

Schmidt 正交化

如何从一组普通的基构造标准正交基?一种方法是Schmidt 正交化法(Gram-Schmidt 过程)

施密特正交化步骤

给定线性无关的向量组 \(\{ \boldsymbol{v}_1, \boldsymbol{v}_2, \dots, \boldsymbol{v}_n\}\),施密特正交化的目标是构造正交向量组 \(\{ \boldsymbol{u}_1, \boldsymbol{u}_2, \dots, \boldsymbol{u}_n\}\)

  1. 初始向量处理
    令第一个正交向量:
    \[ \boldsymbol{u}_1 = \boldsymbol{v}_1 \]
    由于 \(\boldsymbol{v}_1 \neq 0\),则 \(\boldsymbol{u}_1 \neq 0\)

  2. 构造第 \(i\) 个向量的正交化
    从第二个向量开始,为了从 \(\boldsymbol{v}_i\) 中去掉前面向量 \(\boldsymbol{u}_1, \dots, \boldsymbol{u}_{i-1}\) 的分量,定义投影:
    \[ \frac{( \boldsymbol{v}_i, \boldsymbol{u}_k)}{( \boldsymbol{u}_k, \boldsymbol{u}_k)} \boldsymbol{u}_k \]
    表示 \(\boldsymbol{v}_i\)\(\boldsymbol{u}_k\) 上的投影。

    去掉与 \(\boldsymbol{u}_1, \dots, \boldsymbol{u}_{i-1}\) 重叠的部分,得到:
    \[ \boldsymbol{u}_i = \boldsymbol{v}_i - \sum_{k=1}^{i-1} \frac{( \boldsymbol{v}_i, \boldsymbol{u}_k)}{( \boldsymbol{u}_k, \boldsymbol{u}_k)} \boldsymbol{u}_k \]

  3. 归一化
    将每个 \(\boldsymbol{u}_i\) 归一化为单位向量:
    \[ \boldsymbol{e}_i = \frac{ \boldsymbol{u}_i}{\left| \boldsymbol{u}_i\right|} \]

最终得到一组正交归一向量
\[ \{ \boldsymbol{e}_1, \boldsymbol{e}_2, \dots, \boldsymbol{e}_n\} \]

有了以上的铺垫,接下来我们正式引入线性变换的概念。线性变换提供了一种在线性空间之间进行映射的框架,其本质在于保持向量空间中的线性结构。通过线性变换,我们可以将一个线性空间的元素映射到另一个线性空间中,并保持加法和标量乘法的运算法则。

线性变换

首先,我们引入 变换 的概念如下:

定义 4:\(V\) 是属于 \(K\) 上的线性空间,\(T\)\(V\) 到自身的一个映射,使对任意向量 \(x\in V\)\(V\) 中都有唯一向量 \(y\) 与之对应,则称 \(T\)\(V\) 的一个 变换算子,记为 \(Tx = y\),称 \(y\)\(x\)\(T\) 下的象,\(x\)\(y\) 的原象。

定义 5: 如果数域 \(K\) 上的线性空间 \(V\) 的一个变换 \(T\) 具有以下性质:

\[ T(kx + ly) = k(Tx) + l(Ty) \]

其中,\(x,y \in V,k,l\in K\),则称 \(T\)\(V\) 的一个 线性变换线性算子

线性变换的性质

不难验证,线性变换有如下性质,且线性空间 \(V\) 上所有的线性变换的集合,在所论的线性运算下,构成一个新的线性空间,记为 \(\text{Hom}(V, V)\),称为线性空间 \(V\)同态

  1. 线性变换的加法\((T_1+ T_2)x = T_1x+T_2x, \forall x\in V\),和仍为线性变换。
    • \(T_1 + T_2 = T_2 + T_1\);
    • \((T_1 + T_2) + T_3 = T_1 + (T_2 + T_3)\);
    • \(T + T_0 = T\);
    • \(T + (-T) = T_0\);
    • 线性变换 \(T\)负变换 \(-T\) 定义为: \[ (-T)x = -(Tx), \forall x\in V \]
  2. 线性变换的数乘\((kT)x = k(Tx), \forall x\in V\),线性变换的数乘仍是线性变换。
    • \(k(T_1 + T_2) = kT_1 + kT_2\);
    • \((k+l)T = kT + lT\);
    • \((kl)T = k(lT)\);
    • \(1 T = T\);

线性变换的矩阵表示

诸如二维平面上的旋转、微分和积分等都是线性变换。考虑到有限维线性空间的向量可以用坐标表示出来,进一步考虑则可以通过坐标把线性变换用矩阵表示出来,从而可以把抽象的变换转化成具体的矩阵来处理。故引入线性变换的 矩阵表示

\(T\) 是线性空间 \(V^n\) 的线性变换,\(x \in V^n\),且 \(x_1, x_2, \dots, x_n\)\(V^n\) 的一个基,则有:
\[ x = a_1x_1 + a_2x_2 + \dots + a_nx_n \]
\[ Tx = a_1(Tx_1) + a_2(Tx_2) + \dots + a_n(Tx_n) \]

这表明,\(V^n\) 的任一向量 \(x\) 的像可以由基像组 \(Tx_1,Tx_2,\dots,Tx_n\) 唯一确定,因为基像组仍 \(\in V^n\),所以有:
\[ \left. \begin{matrix} Tx_1 = a_{11}x_1 + a_{21}x_2 + \dots + a_{n1}x_n\\ Tx_2 = a_{12}x_1 + a_{22}x_2 + \dots + a_{n2}x_n\\ \cdots \\ Tx_n = a_{1n}x_1 + a_{2n}x_2 + \dots + a_{nn}x_n\\ \end{matrix} \right\} \tag{2.6.1} \]
即:
\[ Tx_i = \sum_{j=1}^{n} a_{ji}x_j, \quad i = 1,2,\dots,n \]
用矩阵乘法表示式 (2.6.1) 为:
\[ T(x_1,x_2,\dots,x_n) = (Tx_1,Tx_2,\dots,Tx_n) = (x_1,x_2,\dots,x_n) \boldsymbol{A} \tag{2.6.2} \]
其中:
\[ \boldsymbol{A} = \begin{bmatrix} a_{11} & a_{12} & \cdots & a_{1n}\\ a_{21} & a_{22} & \cdots & a_{2n}\\ \cdots & \cdots & & \cdots\\ a_{n1} & a_{n2} & \cdots & a_{nn}\\ \end{bmatrix} \]
即矩阵 \(\boldsymbol{A}\) 的第 \(i\) 列为 \(Tx_i\) 的坐标。

定义 3 式 (2.6.2) 中的矩阵 \(\boldsymbol{A}\) 称为 \(T\)\(V^n\) 的基 \(x_1, x_2, \dots, x_n\) 下的矩阵,称 \(\boldsymbol{A}\) 为线性变换 \(T\) 的矩阵表示。

特殊的线性变换

  1. 零变换\(T_0(x) = \boldsymbol{0}, \forall x\in V\)
  2. 恒等变换\(T_1(x) = x, \forall x\in V\)

正交变换

定义 4\(V\) 为欧式空间,\(T\)\(V\) 上的一个线性变换,如果 \(T\) 保持 \(V\) 中任意向量 \(\boldsymbol{x}\) 的长度不变,则有:
\[ (T \boldsymbol{x},T \boldsymbol{x}) = ( \boldsymbol{x}, \boldsymbol{x}) \]
那么称 \(T\)\(V\) 的一个 正交变换

定理 1 欧式空间上的线性变换是正交变换 \(\Leftrightarrow\) 它对于标准正交基的矩阵是正交矩阵。

对称变换

定义 5\(V\) 为欧式空间,\(T\)\(V\) 上的一个线性变换,且对 \(V\) 中任意两个向量 \(\boldsymbol{x}, \boldsymbol{y}\),都有:
\[ (T \boldsymbol{x}, \boldsymbol{y}) = ( \boldsymbol{x},T \boldsymbol{y}) \]
那么称 \(T\)\(V\) 的一个 对称变换

定理 2 欧式空间上的线性变换是对称变换 \(\Leftrightarrow\) 它对于标准正交基的矩阵是实对称矩阵。

对于线性变换的进一步求解,将在下一节中叙述。