1911 字
10 分钟
线性空间和矩阵的四个核心子空间
2026-03-10
无标签

速通#

矩阵 A:Rm×n,rank(A)=rA: \mathbb{R}^{m \times n},rank(A)=r

名称记号所在空间维度描述
列空间Col(A)Col(A)Rm\mathbb{R}^mrrA能产生的所有输出
零空间Null(A)Null(A)Rn\mathbb{R}^nnrn-r被压缩掉的方向,满足 Ax=0Ax=0 的所有解
行空间Row(A)Row(A)Rn\mathbb{R}^nrr输入中有效方向,由A的行向量张成的空间
左零空间Null(AT)Null(A^T)Rm\mathbb{R}^mmrm-r输出中无法达到的方向,满足 ATy=0A^T y=0

直和分解关系:

Rn=Row(A)Null(A)Rm=Col(A)Null(AT)\mathbb{R}^n = Row(A) \oplus Null(A)\\ \mathbb{R}^m = Col(A) \oplus Null(A^T)
  • 列空间 Col(AA):所有 AxAx 的集合(A能产生的所有输出)
  • 零空间 Null(AA):所有满足 Ax=0Ax=0 的解
  • 行空间 Row(AA):A的行向量张成的空间
  • 左零空间 Null(ATA^T):所有满足 ATy=0A^T y=0 的向量

简单来说,线性空间不仅仅是一堆箭头的集合,它是一套游戏规则。只要满足这套规则的数学对象(无论是坐标、函数、矩阵还是多项式),我们都可以用统一的线性代数语言去处理它们。

线性空间的定义#

线性空间是一个由 “加法”“数乘” 定义的封闭世界:

VV 是一个非空集合,FF 是一个数域:

  1. 存在加法运算:对 VV 中任意两个元素 α\alphaβ\beta,在 VV 中都有唯一的元素 vv 与之相对应, 称之为 α\alphaβ\beta 的和,记为 v=α+βv = \alpha + \beta,且满足下面四条法则:

    • a) 交换律:α+β=β+α\alpha + \beta = \beta + \alpha
    • b) 结合律:α+(β+γ)=(α+β)+γ\alpha + (\beta + \gamma) = (\alpha + \beta) + \gamma,其中 γV\gamma \in V
    • c) 零元素:在 VV 中有一元素 00,对于 αV\forall \alpha \in Vα+0=α\alpha + 0 = \alpha
    • d) 负元素:对于 αV\forall \alpha \in V,都存在 βV\beta \in V,使得 α+β=0\alpha + \beta = 0
    • 注意这里的 0 是指零元素(0 ∈ V)
  2. 存在数乘运算:对 VV 中任意元素 α\alpha 与 F 中任意元素 kk,在 VV 中都有唯一的元素 η\eta 与 它们相对应,称之为 α\alphakk 的数乘,记为 η=kα=kα\eta = k \cdot \alpha = k\alpha,且满足下面四条法则:

    • a) 数 1 的乘法:1α=α1 \cdot \alpha = \alpha
    • b) 数域 F 中的乘法关系:k(lα)=(kl)αk(l\alpha) = (kl)\alpha
    • c) 对 F 中数的加法分配律:(k+l)α=kα+lα(k + l)\alpha = k\alpha + l\alpha
    • d) 对 V 中元素的加法分配律:对于 k(α+β)=kα+kβk(\alpha + \beta) = k\alpha + k\beta
    • 其中,k,lk, l 为数域 FF 中的任意数,α\alpha, β\beta 为集合 VV 中的任意元素。

线性空间的子空间#

假设 VVFF 上的线性空间,若存在 WVW \subseteq V 使得: 1 加法封闭性:对任意的 α,βW\alpha, \beta \in W,均有 α+βW\alpha + \beta \in W; 2 数乘封闭性:对任意的 αW\alpha \in WkFk \in F,均有 kαWk \cdot \alpha \in W。 则称 WWVV 的子空间。

例如:

  • 二维空间中过原点的共线向量的集合。

  • 三维空间中过原点的共面向量的集合。

线性映射#

假设 VVWWFF 上的线性空间。若存在函数 T:VWT : V \rightarrow W,满足下列的齐次和可加性:

  1. 对任意的 α,βV\alpha, \beta \in V,均有 T(α+β)=T(α)+T(β)T(\alpha + \beta) = T(\alpha) + T(\beta)
  2. 对任意的 αV\alpha \in VkFk \in F,均有 T(kα)=kT(α)T(k\alpha) = kT(\alpha)

TTVVWW线性映射

线性映射与他的矩阵表示#

旋转、缩放、投影等几何变换都是线性映射的例子。对于这些线性映射,我们可以用矩阵来表示它们的作用。例如,在二维空间中,旋转一个向量 v\mathbf{v} 可以通过一个旋转矩阵 RR 来实现:

R=[cosθsinθsinθcosθ]R = \begin{bmatrix} \cos \theta & -\sin \theta \\ \sin \theta & \cos \theta \end{bmatrix}

当我们将向量 v\mathbf{v} 乘以这个矩阵 RR 时,我们就得到了旋转后的向量 RvR\mathbf{v}

矩阵的初等变换(就是行列操作,不改变矩阵的秩)也是一种线性映射,也可以由矩阵表示,可以归结为三种基本的行列操作:

  1. 交换:第 ii 行和第 jj 行的交换,第 ii 列和第 jj 列的交换
  2. 相加:第 jj 行的 cc 倍加到第 ii 行,第 jj 列的 cc 倍加到第 ii
  3. 伸缩:第 ii 行乘上标量 cc 倍,第 ii 列乘上标量 cc

这些矩阵被称为初等矩阵(也叫基本矩阵)。

参考矩阵的初等变换一文,了解初等矩阵的定义、性质和在矩阵运算中的应用。

矩阵张成的空间#

NOTE

注意这里定义列空间的时候并没有强调矩阵 AA 列向量的相关性,因为无论列向量是否相关,列空间都是由这些列向量的线性组合构成的。 其他空间同理

  • 列空间/值域空间:包含了 AA 列向量所有可能的组合,维度由秩决定,属于 RmR^m
C(A)=span{a,1,a,2,...,a,n}={yy=k1a,1+k2a,2++kna,n,kiR}={yy=Ax,xRn}C(A) = span\{a_{∗,1}, a_{∗,2}, . . . , a_{∗,n}\} = \{y | y = k_1a_{∗,1} + k_2a_{∗,2} + · · · + k_n a_{∗,n}, k_i ∈ R\}\\ =\{y | y = A\mathbf{x}, \mathbf{x} \in R^n\}
  • 行空间:包含了 ATA^T 列向量(AA 行向量)所有可能的组合,维度由秩决定,属于 RnR^n
C(AT)=span{a1,,a2,,...,am,}={yy=k1a1,+k2a2,++kmam,,kiR}={yy=ATx,xRm}C(A^T) = span\{a_{1,∗}, a_{2,∗}, . . . , a_{m,∗}\} = \{y | y = k_1a_{1,∗} + k_2a_{2,∗} + · · · + k_m a_{m,∗}, k_i ∈ R\}\\ =\{y | y = A^T\mathbf{x}, \mathbf{x} \in R^m\}
  • (右)零空间: Ax=0A\mathbf{x} = 0 的所有解x\mathbf{x}所构成的空间,维度是 nrn-r ,属于 RnR^n
N(A)={xAx=0},N(A) = \{\mathbf{x} | A\mathbf{x} = 0\},
  • 左零空间: ATx=0A^T\mathbf{x} = \mathbf{0}xTA=0T\mathbf{x}^T A = \mathbf{0}^T 的所有解 x\mathbf{x} 所构成的空间,维度是 mrm-r ,属于 RmR^m
N(AT)={xxTA=0T}.N(A^T) = \{\mathbf{x} | \mathbf{x}^T A = \mathbf{0}^T\}.

The Big Picture#

alt text

这个图揭示了任何矩阵 AA 背后的四个核心子空间,以及它们如何精妙地分布在输入空间 Rn\mathbb{R}^n 和输出空间 Rm\mathbb{R}^m 中。

左侧:输入空间 Rn\mathbb{R}^nnn 维空间)#

这里是所有向量 x\mathbf{x} 的家。它被切割成了两个相互垂直(正交)的部分:

  • 行空间 C(AT)C(A^T):含义:由矩阵 AA 的行向量组合而成的空间。

    • 物理意义:这是 AA 真正能“抓取”并变换的信息部分。如果一个向量落在行空间,它被 AA 乘以之后,一定会变成一个非零向量。
  • 零空间 N(A)N(A):含义:所有满足 Ax=0A\mathbf{x} = \mathbf{0} 的向量 x\mathbf{x}

    • 物理意义:这是 AA 的“黑洞”。任何落入这个空间的向量,经过 AA 变换后都会消失(变成零)。
  • 关系:行空间与零空间是正交补。也就是说,任何输入向量 x\mathbf{x} 都可以唯一地拆解为一个“有用成分”(行空间)和一个“被抹除成分”(零空间)。

右侧:输出空间 Rm\mathbb{R}^mmm 维空间)#

这里是变换后的结果 b\mathbf{b}(即 AxA\mathbf{x})所在的家。它同样被切割为两部分

  • 列空间 C(A)C(A):含义:由矩阵 AA 的列向量组合而成。
    • 物理意义:方程 Ax=bA\mathbf{x} = \mathbf{b} 有解的充要条件是 b\mathbf{b} 落在列空间里。
  • 左零空间 N(AT)N(A^T):含义:所有满足 ATy=0A^T\mathbf{y} = \mathbf{0} 的向量 y\mathbf{y}
    • 物理意义:在图论中,这对应着 电流定律 (KCL):流入等于流出。它描述了系统中的“环流”或平衡状态。

维度#

维度的守恒(秩):行空间和列空间的维度完全相等,都等于矩阵的秩 rrrankrank)。这意味着 AA 能输出多少维的信息,完全取决于它从输入端抓取了多少维的有效信息。

垂直性(正交):注意图中两对空间都是成 9090^\circ 直角排列的。这意味着 AA 的每一行都垂直于零空间里的向量。

行空间 C(AT)C(A^T) 的正交补是 零空间 N(A)N(A)

TIP

为什么?因为 Ax=0Ax=0 的定义就是:AA 的每一行向量与 xx 的内积都等于 0。这意味着 xx 垂直于 AA 的所有行。

列空间 C(A)C(A) 的正交补是 左零空间 N(AT)N(A^T)

线性空间和矩阵的四个核心子空间
https://biscuit0613.github.io/posts/lineralgebra/linearspace/
作者
Biscuit
发布于
2026-03-10
许可协议
CC BY-NC-SA 4.0