注:本文为 “线性代数 | 行图像 / 列图像” 相关合辑。
图片清晰度受引文原图所限。
略作重排,未整理去重。
如有内容异常,请看原文。
MIT 线性代数笔记一 行图像和列图像
线性代数行图像与列图像解析
herosunly 已于 2022-01-25 15:34:26 修改
1. 学习背景回顾
若干年前,王清老师曾讲授线性代数课程。该课程授课音量较小,后排学生难以清晰聆听。根据模糊记忆,课程首讲内容为利用行列式求解方程组(即克莱姆法则),后续依次讲解矩阵的各类运算(包括加法、乘法、求逆与转置)、初等行变换,最终涉及特征值与特征向量的求解。整个学习过程以运算训练为主,却未阐明各类运算的本质意义。当时曾产生疑问:线性代数的核心是否仅为各类运算规则?但该疑问未得到进一步探究。
2. 当前学习规划
自 2018 年(大一时期)起,至今已过去十一年。2022 年新年的首要目标为系统学习李宏毅老师的《机器学习》。在学习“线性回归”章节时,为深化对理论知识的理解,需进行公式推导,此过程涉及矩阵求导公式的应用。为掌握该知识点,制定如下学习笔记。
3. 第一讲 行图像和列图像
3.1 线性方程组的矩阵表示
线性代数的核心问题之一是求解
n
n
n 元一次方程组。以二元一次方程组为例,其表达式如下:
{
2
x
−
y
=
0
−
x
+
2
y
=
3
\begin{cases} 2x - y = 0 \\ -x + 2y = 3 \end{cases}
{2x−y=0−x+2y=3
将上述方程组用矩阵形式表示,可得:
[
2
−
1
−
1
2
]
[
x
y
]
=
[
0
3
]
\begin{bmatrix} 2 & -1 \\ -1 & 2 \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} = \begin{bmatrix} 0 \\ 3 \end{bmatrix}
[2−1−12][xy]=[03]
其中,
A
=
[
2
−
1
−
1
2
]
\boldsymbol{A} = \begin{bmatrix} 2 & -1 \\ -1 & 2 \end{bmatrix}
A=[2−1−12] 称为系数矩阵,
x
=
[
x
y
]
\boldsymbol{x} = \begin{bmatrix} x \\ y \end{bmatrix}
x=[xy] 称为未知数向量,等号右侧的向量记为
b
\boldsymbol{b}
b。由此,方程组可简化为矩阵方程:
A
x
=
b
\boldsymbol{A}\boldsymbol{x} = \boldsymbol{b}
Ax=b。
3.2 行图像
行图像的几何意义与解析几何一致:在二维平面中,每个二元一次方程对应一条直线。绘制方程组中两个方程对应的直线,两条直线的交点坐标即为方程组的解。对于上述方程组,解得 x = 1 x = 1 x=1, y = 2 y = 2 y=2。
注:上图由 Wolfram Alpha 绘制生成:
- 2x-y = 0 and -x+2y=3 - Wolfram|Alpha
https://www.wolframalpha.com/input/?i=2x-y+%3D+0+and+-x%2B2y%3D3
3.3 列图像
3.3.1 列图像的核心思想
列图像分析的核心是将系数矩阵按列分解为若干列向量,此时求解原方程组等价于寻找列向量的线性组合,使其结果等于向量
b
\boldsymbol{b}
b。对于上述二元一次方程组,按列分解后可表示为:
x
⋅
[
2
−
1
]
+
y
⋅
[
−
1
2
]
=
[
0
3
]
x \cdot \begin{bmatrix} 2 \\ -1 \end{bmatrix} + y \cdot \begin{bmatrix} -1 \\ 2 \end{bmatrix} = \begin{bmatrix} 0 \\ 3 \end{bmatrix}
x⋅[2−1]+y⋅[−12]=[03]
3.3.2 线性组合的定义
“向量的线性组合”是线性代数的核心概念之一,其运算包含两部分:
- 向量加法:需满足平行四边形法则或三角形法则;
- 向量数乘:对向量进行伸缩变换(系数大于 1 时向量伸展,系数大于 0 且小于 1 时向量收缩,系数小于 0 时向量反向并伸缩)。
特别地,若一组向量构成空间的“基向量”,则该空间内任意向量均可表示为这组基向量的线性组合。
3.3.3 列图像的几何意义
从几何角度看,列图像的求解目标是寻找系数 x x x 和 y y y,使得 x x x 与第一个列向量的数乘结果,与 y y y 与第二个列向量的数乘结果相加后,恰好等于向量 [ 0 3 ] \begin{bmatrix} 0 \\ 3 \end{bmatrix} [03]。
3.3.4 列图像的优势(以三元方程组为例)
对于二元方程组,行图像与列图像的优势差异不明显;但对于多元方程组,列图像的优势将显著体现。以三元一次方程组为例:
{
x
+
2
y
+
3
z
=
6
2
x
+
5
y
+
2
z
=
4
6
x
−
3
y
+
z
=
2
\begin{cases} x + 2y + 3z = 6 \\ 2x + 5y + 2z = 4 \\ 6x - 3y + z = 2 \end{cases}
⎩
⎨
⎧x+2y+3z=62x+5y+2z=46x−3y+z=2
对于矩阵方程
A
x
=
b
\boldsymbol{A}\boldsymbol{x} = \boldsymbol{b}
Ax=b:
- 若改变向量 b \boldsymbol{b} b 的数值,行图像中每个方程对应的平面均会发生变化,需重新分析平面间的位置关系;
- 列图像中,系数矩阵的列向量保持不变,仅需寻找新的线性组合系数即可,求解逻辑更简洁。
3.3.5 方程组有解的充要条件
- 核心问题:对于任意向量 b \boldsymbol{b} b,矩阵方程 A x = b \boldsymbol{A}\boldsymbol{x} = \boldsymbol{b} Ax=b 是否均有解?(此处“任意”指所有可能的 b \boldsymbol{b} b)
- 列图像视角的转化:该问题等价于“系数矩阵的列向量的线性组合是否覆盖整个线性空间?”(选择线性空间作为研究对象,是因为 n n n 元一次方程组的解空间本质为线性空间)。
- 无解情况的反例:若系数矩阵的列向量线性相关(例如,第三个列向量恰好等于第一个列向量减去第二个列向量),则所有列向量将共面(二维平面);若向量 b \boldsymbol{b} b 不在该平面内,则列向量的任意线性组合均无法得到 b \boldsymbol{b} b,此时方程组无解。
- 奇异矩阵的定义:当列向量线性相关时,系数矩阵 A \boldsymbol{A} A 称为奇异阵(或不可逆矩阵)。在奇异阵条件下,并非所有 b \boldsymbol{b} b 都能使 A x = b \boldsymbol{A}\boldsymbol{x} = \boldsymbol{b} Ax=b 有解。
- 一般结论:对于 n n n 维线性空间,若系数矩阵的 n n n 个列向量满足线性无关(即任意一个列向量均不能表示为其他列向量的线性组合),则对于任意 b \boldsymbol{b} b,方程组 A x = b \boldsymbol{A}\boldsymbol{x} = \boldsymbol{b} Ax=b 均有解;若列向量线性相关,则其线性组合无法充满 n n n 维空间,方程组未必有解。
3.3.6 行图像与列图像的维度对比
从行图像视角分析三元方程组的解:
- 有唯一解:三个平面相交于一点;
- 无解:至少两个平面平行,或任意两个平面的交线互相平行;
- 无穷多解:三个平面相交于一条直线。
但当空间维度升高(如 n > 3 n > 3 n>3)时,行图像无法直观绘制,交点位置更难以分析。而列图像通过“线性组合”的思想,将高维空间的解问题转化为向量组合问题,显著降低了分析复杂度。
3.4 总结
线性方程组可等价表示为矩阵方程 A x = b \boldsymbol{A}\boldsymbol{x} = \boldsymbol{b} Ax=b:
- 从“行视角”分析矩阵 A \boldsymbol{A} A,得到的是方程组中的每个独立方程,其几何意义为空间中的超平面;
- 从“列视角”分析矩阵 A \boldsymbol{A} A,得到的是系数矩阵的列向量,其核心是通过列向量的线性组合构造向量 b \boldsymbol{b} b。
矩阵作为融合两种视角且逻辑自洽的数学工具,是线性代数中的重要创举,为高维线性问题的分析提供了统一框架。
MIT—线性代数笔记 行图像和列图像
三少爷的键 编辑于 2018-10-10 13:33
1 行图像与列图像的基本概念(Row Picture & Column Picture)
1.1 线性方程的几何表示(The Geometry of Linear Equations)
线性代数的核心问题之一是求解
n
n
n 元一次线性方程组。以二元一次线性方程组为例,其标准形式如下:
{
2
x
−
y
=
0
−
x
+
2
y
=
3
\begin{cases} 2x - y = 0 \\ -x + 2y = 3 \end{cases}
{2x−y=0−x+2y=3
将上述方程组表示为矩阵形式
A
x
=
b
\boldsymbol{A}\boldsymbol{x} = \boldsymbol{b}
Ax=b,可得:
[
2
−
1
−
1
2
]
[
x
y
]
=
[
0
3
]
\begin{bmatrix} 2 & -1 \\ -1 & 2 \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix}= \begin{bmatrix} 0 \\ 3 \end{bmatrix}
[2−1−12][xy]=[03]
其中各矩阵/向量的定义如下:
- 系数矩阵(Coefficient Matrix): A = [ 2 − 1 − 1 2 ] \boldsymbol{A} = \begin{bmatrix} 2 & -1 \\ -1 & 2 \end{bmatrix} A=[2−1−12],用于存储方程组中未知数的系数;
- 未知数向量(Unknown Vector):通常记为 x = [ x y ] \boldsymbol{x} = \begin{bmatrix} x \\ y \end{bmatrix} x=[xy],包含方程组中所有待求的未知量;
- 常数项向量(Constant Term Vector):记为 b = [ 0 3 ] \boldsymbol{b} = \begin{bmatrix} 0 \\ 3 \end{bmatrix} b=[03],包含方程组等号右侧的常数项。
2 行图像(Row Picture)
2.1 行图像的几何意义
行图像基于解析几何的思想,将线性方程组中的每个方程对应为几何空间中的一条直线(二元情形)或一个平面(三元情形)。对于二元一次方程,通过以下步骤可确定其对应的直线:
- 求解方程的两组解(即满足方程的 ( x , y ) (x, y) (x,y) 坐标对);
- 在 x - y x\text{-}y x-y 平面上标记两组解对应的点;
- 连接两点形成的直线,即为该方程的行图像。
2.2 行图像的求解原理
线性方程组的解对应于所有方程行图像的交点。对于本节中的二元方程组:
- 方程 2 x − y = 0 2x - y = 0 2x−y=0 的行图像为一条直线;
- 方程 − x + 2 y = 3 -x + 2y = 3 −x+2y=3 的行图像为另一条直线;
- 两条直线的交点坐标 ( x , y ) = ( 1 , 2 ) (x, y) = (1, 2) (x,y)=(1,2),即为方程组的解。
3 列图像(Column Picture)
3.1 列图像的核心思想
列图像的本质是将系数矩阵
A
\boldsymbol{A}
A 按列分解为列向量,将方程组
A
x
=
b
\boldsymbol{A}\boldsymbol{x} = \boldsymbol{b}
Ax=b 转化为列向量的线性组合问题。对于本节中的二元方程组,系数矩阵的列向量分解形式如下:
x
⋅
[
2
−
1
]
+
y
⋅
[
−
1
2
]
=
[
0
3
]
x \cdot \begin{bmatrix} 2 \\ -1 \end{bmatrix} + y \cdot \begin{bmatrix} -1 \\ 2 \end{bmatrix} = \begin{bmatrix} 0 \\ 3 \end{bmatrix}
x⋅[2−1]+y⋅[−12]=[03]
其中,
x
x
x 和
y
y
y 是线性组合的系数(即方程组的未知数),目标是找到一组
x
,
y
x, y
x,y,使得列向量的线性组合结果等于常数项向量
b
\boldsymbol{b}
b。
3.2 线性组合的定义
对于给定的向量 c \boldsymbol{c} c、 d \boldsymbol{d} d 及标量 x x x、 y y y,表达式 x c + y d x\boldsymbol{c} + y\boldsymbol{d} xc+yd 称为向量 c \boldsymbol{c} c 与 d \boldsymbol{d} d 的一个线性组合。线性组合是线性代数中的核心概念,贯穿整个课程体系。
3.3 列图像的几何意义与求解
从几何角度看,列图像的求解过程是:找到标量 x x x、 y y y,使得列向量分别乘以 x x x、 y y y 后,通过“首尾相接”的向量加法得到 b \boldsymbol{b} b。对于本节的方程组:
- 蓝色向量为 [ 2 − 1 ] \begin{bmatrix} 2 \\ -1 \end{bmatrix} [2−1],乘以 x = 1 x = 1 x=1 后得到 1 ⋅ [ 2 − 1 ] = [ 2 − 1 ] 1 \cdot \begin{bmatrix} 2 \\ -1 \end{bmatrix} = \begin{bmatrix} 2 \\ -1 \end{bmatrix} 1⋅[2−1]=[2−1];
- 红色向量为 [ − 1 2 ] \begin{bmatrix} -1 \\ 2 \end{bmatrix} [−12],乘以 y = 2 y = 2 y=2 后得到 2 ⋅ [ − 1 2 ] = [ − 2 4 ] 2 \cdot \begin{bmatrix} -1 \\ 2 \end{bmatrix} = \begin{bmatrix} -2 \\ 4 \end{bmatrix} 2⋅[−12]=[−24];
- 两向量相加: [ 2 − 1 ] + [ − 2 4 ] = [ 0 3 ] = b \begin{bmatrix} 2 \\ -1 \end{bmatrix} + \begin{bmatrix} -2 \\ 4 \end{bmatrix} = \begin{bmatrix} 0 \\ 3 \end{bmatrix} = \boldsymbol{b} [2−1]+[−24]=[03]=b,因此解得 x = 1 x = 1 x=1, y = 2 y = 2 y=2。
3.4 列向量线性组合的空间覆盖
若任意选取标量 x x x、 y y y,则列向量 [ 2 − 1 ] \begin{bmatrix} 2 \\ -1 \end{bmatrix} [2−1] 与 [ − 1 2 ] \begin{bmatrix} -1 \\ 2 \end{bmatrix} [−12] 的所有线性组合将布满整个 x - y x\text{-}y x-y 平面。下图展示了该过程的几何直观:
注:在 D.C.Lay 所著的《线性代数及其应用》中,曾绘制向量 v 1 = [ − 1 1 ] \boldsymbol{v}_1 = \begin{bmatrix} -1 \\ 1 \end{bmatrix} v1=[−11] 与 v 2 = [ 1 2 ] \boldsymbol{v}_2 = \begin{bmatrix} 1 \\ 2 \end{bmatrix} v2=[12] 的线性组合图像,其整数倍线性组合的端点在平面上形成网格,直观体现了线性组合对平面的覆盖。该书注重通过几何图像辅助理解线性代数概念,英文版已更新至第 5 版,中文版由华章出版社出版。
4 三元线性方程组的行图像与列图像
将上述二元情形的讨论扩展到三元情形,考虑如下三元一次线性方程组(选取 G. Strang 教材中的示例以匹配配图):
{
x
+
2
y
+
3
z
=
6
2
x
+
5
y
+
2
z
=
4
6
x
−
3
y
+
z
=
2
\begin{cases} x + 2y + 3z = 6 \\ 2x + 5y + 2z = 4 \\ 6x - 3y + z = 2 \end{cases}
⎩
⎨
⎧x+2y+3z=62x+5y+2z=46x−3y+z=2
其矩阵形式为:
[
1
2
3
2
5
2
6
−
3
1
]
[
x
y
z
]
=
[
6
4
2
]
\begin{bmatrix} 1 & 2 & 3 \\ 2 & 5 & 2 \\ 6 & -3 & 1 \end{bmatrix} \begin{bmatrix} x \\ y \\ z \end{bmatrix}= \begin{bmatrix} 6 \\ 4 \\ 2 \end{bmatrix}
12625−3321
xyz
=
642
4.1 三元方程组的行图像
三元一次方程的行图像为三维空间中的一个平面,方程组的解对应于三个平面的交点:
- 若三个平面相交于唯一一点,则方程组有唯一解;
- 若三个平面无公共交点(如存在平行平面、两两交线平行),则方程组无解;
- 若三个平面相交于一条直线,则方程组有无穷多解。
下图展示了该三元方程组行图像的几何直观(三个平面的相交关系):
注:G. Strang 在授课中曾提及自身作图局限性,其教材中通过“两平面交线与第三平面相交”的分步图示展示解的存在性;而 D.C.Lay 的教材则通过单张图更简洁地呈现了三维平面的相交关系。
4.2 三元方程组的列图像
将系数矩阵按列分解,三元方程组的列图像形式为列向量的线性组合:
x
⋅
[
1
2
6
]
+
y
⋅
[
2
5
−
3
]
+
z
⋅
[
3
2
1
]
=
[
6
4
2
]
x \cdot \begin{bmatrix} 1 \\ 2 \\ 6 \end{bmatrix} + y \cdot \begin{bmatrix} 2 \\ 5 \\ -3 \end{bmatrix} + z \cdot \begin{bmatrix} 3 \\ 2 \\ 1 \end{bmatrix} = \begin{bmatrix} 6 \\ 4 \\ 2 \end{bmatrix}
x⋅
126
+y⋅
25−3
+z⋅
321
=
642
其几何意义为:寻找标量
x
,
y
,
z
x, y, z
x,y,z,使得三个列向量分别数乘后相加得到
b
\boldsymbol{b}
b。下图为该线性组合的几何示意图:
4.3 方程组解的存在性问题
对于三元方程组 A x = b \boldsymbol{A}\boldsymbol{x} = \boldsymbol{b} Ax=b,一个核心问题是:是否对所有的 b \boldsymbol{b} b,方程组均有解?
从列图像角度,该问题等价于:系数矩阵 A \boldsymbol{A} A 的列向量的线性组合是否能覆盖整个三维空间?
- 若三个列向量“线性无关”(即不存在一个列向量可由另外两个列向量线性表示),则其线性组合可覆盖整个三维空间,对任意 b \boldsymbol{b} b,方程组均有解;
- 若三个列向量“线性相关”(如列 3 = 列 1 + 列 2),则所有列向量共面,其线性组合仅能覆盖该平面。若 b \boldsymbol{b} b 不在此平面内,方程组无解。此时矩阵 A \boldsymbol{A} A 称为奇异矩阵(Singular Matrix) 或不可逆矩阵(Non-invertible Matrix)。
下图对比了 G. Strang 与 D.C.Lay 教材中对三元方程组行图像(平面相交关系)的作图差异:
5 矩阵与向量的乘法规则
矩阵与向量的乘法 A x \boldsymbol{A}\boldsymbol{x} Ax 有两种等价的计算方式,分别对应列图像与行图像的思想。
5.1 基于列向量线性组合的计算(列图像视角)
将矩阵
A
\boldsymbol{A}
A 按列分解为列向量,
A
x
\boldsymbol{A}\boldsymbol{x}
Ax 即为列向量的线性组合。以矩阵
A
=
[
2
5
1
3
]
\boldsymbol{A} = \begin{bmatrix} 2 & 5 \\ 1 & 3 \end{bmatrix}
A=[2153] 与向量
x
=
[
1
2
]
\boldsymbol{x} = \begin{bmatrix} 1 \\ 2 \end{bmatrix}
x=[12] 为例:
A
x
=
[
2
5
1
3
]
[
1
2
]
=
1
⋅
[
2
1
]
+
2
⋅
[
5
3
]
=
[
2
+
10
1
+
6
]
=
[
12
7
]
\boldsymbol{A}\boldsymbol{x} = \begin{bmatrix} 2 & 5 \\ 1 & 3 \end{bmatrix} \begin{bmatrix} 1 \\ 2 \end{bmatrix} = 1 \cdot \begin{bmatrix} 2 \\ 1 \end{bmatrix} + 2 \cdot \begin{bmatrix} 5 \\ 3 \end{bmatrix} = \begin{bmatrix} 2 + 10 \\ 1 + 6 \end{bmatrix} = \begin{bmatrix} 12 \\ 7 \end{bmatrix}
Ax=[2153][12]=1⋅[21]+2⋅[53]=[2+101+6]=[127]
5.2 基于行向量点积的计算(行图像视角)
将矩阵
A
\boldsymbol{A}
A 的每一行视为行向量,
A
x
\boldsymbol{A}\boldsymbol{x}
Ax 的每个分量为对应行向量与
x
\boldsymbol{x}
x 的点积。仍以上述矩阵与向量为例:
A
x
=
[
2
5
1
3
]
[
1
2
]
=
[
(
2
⋅
1
+
5
⋅
2
)
(
1
⋅
1
+
3
⋅
2
)
]
=
[
2
+
10
1
+
6
]
=
[
12
7
]
\boldsymbol{A}\boldsymbol{x} = \begin{bmatrix} 2 & 5 \\ 1 & 3 \end{bmatrix} \begin{bmatrix} 1 \\ 2 \end{bmatrix} = \begin{bmatrix} (2 \cdot 1 + 5 \cdot 2) \\ (1 \cdot 1 + 3 \cdot 2) \end{bmatrix} = \begin{bmatrix} 2 + 10 \\ 1 + 6 \end{bmatrix} = \begin{bmatrix} 12 \\ 7 \end{bmatrix}
Ax=[2153][12]=[(2⋅1+5⋅2)(1⋅1+3⋅2)]=[2+101+6]=[127]
两种计算方式的结果完全一致,分别从列图像(线性组合)与行图像(点积)的角度诠释了矩阵与向量乘法的本质。
矩阵的几何意义:行图像与列图像的系统解析
孙梓轩 编辑于 2025-08-08 10:10・美国
1. 行空间的几何意义与方程组解的关联
线性方程组的行图像,本质是将方程组中每个方程对应为其所在维度空间中的“解空间”,方程组的解即为所有解空间的交集。以下从二维情形出发,逐步剖析行图像的几何特征与方程组可解性的关系。
1.1 二元一次方程组的行图像示例(有解情形)
以二元一次方程组为例:
{
x
+
2
y
=
5
2
x
+
3
y
=
7
\begin{cases} x + 2y = 5 \\ 2x + 3y = 7 \end{cases}
{x+2y=52x+3y=7
该方程组中,每个方程对应 2 维空间(
R
2
\mathbb{R}^2
R2) 中的一条直线:
- 方程 x + 2 y = 5 x + 2y = 5 x+2y=5 的解空间是一条斜率为 − 1 2 -\frac{1}{2} −21 的直线;
- 方程 2 x + 3 y = 7 2x + 3y = 7 2x+3y=7 的解空间是一条斜率为 − 2 3 -\frac{2}{3} −32 的直线。
两条直线的交点即为方程组的解( x = − 1 , y = 3 x = -1, y = 3 x=−1,y=3)。从几何上看,只要不同方程对应的直线不平行,就存在唯一交点,方程组有唯一解。
需注意:直线在空间中沿其延伸方向无限延展,并非局限于有限坐标范围(如 x ∈ [ − 10 , 10 ] , y ∈ [ − 10 , 10 ] x \in [-10,10], y\in [-10,10] x∈[−10,10],y∈[−10,10]),因此解的存在性仅由直线的相对位置决定,与坐标范围无关。
1.2 二元一次方程组的行图像示例(无解情形)
考虑无解的二元一次方程组:
{
x
+
2
y
=
5
2
x
+
4
y
=
7
\begin{cases} x + 2y = 5 \\ 2x + 4y = 7 \end{cases}
{x+2y=52x+4y=7
其对应的行图像为两条平行直线(斜率均为
−
1
2
-\frac{1}{2}
−21),无任何交点,因此方程组无解。
从系数角度分析:两条直线平行的充要条件是“方程中未知数系数成比例,且常数项不成比例”。具体表现为系数矩阵的两行成比例——设系数矩阵 A = [ a 1 b 1 a 2 b 2 ] \boldsymbol{A} = \begin{bmatrix} a_1 & b_1 \\ a_2 & b_2 \end{bmatrix} A=[a1a2b1b2],则 a 1 a 2 = b 1 b 2 ≠ c 1 c 2 \frac{a_1}{a_2} = \frac{b_1}{b_2} \neq \frac{c_1}{c_2} a2a1=b2b1=c2c1($ c_1, c_2 $ 为常数项)。
1.3 二元一次方程组的行图像示例(无穷多解情形)
若方程组满足“系数成比例且常数项成比例”,则对应的直线完全重合,解空间为整条直线,方程组有无穷多解。例如:
{
x
+
2
y
=
5
2
x
+
4
y
=
10
\begin{cases} x + 2y = 5 \\ 2x + 4y = 10 \end{cases}
{x+2y=52x+4y=10
系数矩阵
A
=
[
1
2
2
4
]
\boldsymbol{A} = \begin{bmatrix} 1 & 2 \\ 2 & 4 \end{bmatrix}
A=[1224] 的两行成比例(第二行是第一行的 2 倍),且常数项
5
5
5 与
10
10
10 也成 2 倍比例,因此两条直线完全重合,所有满足
x
+
2
y
=
5
x + 2y = 5
x+2y=5 的
(
x
,
y
)
(x,y)
(x,y) 均为解。
1.4 行向量的线性相关性与方程组可解性
将系数矩阵 A \boldsymbol{A} A 的每一行视为一个 行向量(如上述示例中, r 1 = [ 1 2 ] , r 2 = [ 2 4 ] \boldsymbol{r}_1 = \begin{bmatrix} 1 & 2 \end{bmatrix}, \boldsymbol{r}_2 = \begin{bmatrix} 2 & 4 \end{bmatrix} r1=[12],r2=[24]),则:
- 若存在非零常数 k k k,使得 r i = k ⋅ r j \boldsymbol{r}_i = k \cdot \boldsymbol{r}_j ri=k⋅rj( i ≠ j i \neq j i=j),则称这两个行向量 线性相关;
- 若不存在这样的 k k k,则称行向量 线性无关。
结合行图像的几何意义,可得出核心结论:
- 若系数矩阵 A \boldsymbol{A} A 的行向量 全部线性无关,则方程组 A x = b \boldsymbol{A}\boldsymbol{x} = \boldsymbol{b} Ax=b 必有解(且解唯一,二维情形下直线不平行、不重合);
- 若存在线性相关的行向量,则方程组可能无解(系数成比例但常数项不成比例),也可能有无穷多解(系数与常数项均成比例)——线性相关是“方程组无解或无穷多解”的必要非充分条件。
1.5 高维情形的行图像推广
行图像的逻辑可自然推广至高维方程组:
- 三元一次方程(3 个未知数)对应的解空间是 3 维空间( R 3 \mathbb{R}^3 R3) 中的一个平面;
- 四元一次方程对应的解空间是 4 维空间( R 4 \mathbb{R}^4 R4) 中的一个“超平面”(无法直观作图,但可通过维度逻辑分析)。
高维方程组的解即为所有超平面(或平面)的交集:交集为一点则有唯一解,交集为一条直线/平面则有无穷多解,无交集则无解。
2. 列空间的几何意义与矩阵乘法的本质
列空间的核心是从“列向量线性组合”的视角理解矩阵乘法 A x = b \boldsymbol{A}\boldsymbol{x} = \boldsymbol{b} Ax=b,即将 A x \boldsymbol{A}\boldsymbol{x} Ax 视为系数矩阵 A \boldsymbol{A} A 的列向量按 x \boldsymbol{x} x 的分量进行线性组合,最终得到 b \boldsymbol{b} b。
2.1 矩阵乘法的两种计算视角
对于矩阵乘法 A x = b \boldsymbol{A}\boldsymbol{x} = \boldsymbol{b} Ax=b(其中 A ∈ R m × n , x ∈ R n × 1 , b ∈ R m × 1 \boldsymbol{A} \in \mathbb{R}^{m \times n}, \boldsymbol{x} \in \mathbb{R}^{n \times 1}, \boldsymbol{b} \in \mathbb{R}^{m \times 1} A∈Rm×n,x∈Rn×1,b∈Rm×1),存在两种等价的计算逻辑:
(1)行视角:行向量与列向量的点积
将
A
\boldsymbol{A}
A 的每一行视为行向量,与
x
\boldsymbol{x}
x(列向量)做点积,结果即为
b
\boldsymbol{b}
b 的对应分量。其通用公式为:
b
i
=
∑
k
=
1
n
A
i
k
⋅
x
k
(
i
=
1
,
2
,
…
,
m
)
b_i = \sum_{k=1}^n A_{ik} \cdot x_k \quad (i = 1,2,\dots,m)
bi=k=1∑nAik⋅xk(i=1,2,…,m)
例如,对于
A
=
[
1
2
2
3
]
,
x
=
[
x
y
]
\boldsymbol{A} = \begin{bmatrix} 1 & 2 \\ 2 & 3 \end{bmatrix}, \boldsymbol{x} = \begin{bmatrix} x \\ y \end{bmatrix}
A=[1223],x=[xy],则:
b
1
=
[
1
2
]
⋅
[
x
y
]
=
x
+
2
y
,
b
2
=
[
2
3
]
⋅
[
x
y
]
=
2
x
+
3
y
b_1 = \begin{bmatrix} 1 & 2 \end{bmatrix} \cdot \begin{bmatrix} x \\ y \end{bmatrix} = x + 2y, \quad b_2 = \begin{bmatrix} 2 & 3 \end{bmatrix} \cdot \begin{bmatrix} x \\ y \end{bmatrix} = 2x + 3y
b1=[12]⋅[xy]=x+2y,b2=[23]⋅[xy]=2x+3y
(2)列视角:列向量的线性组合
将
A
\boldsymbol{A}
A 的每一列视为列向量,以
x
\boldsymbol{x}
x 的分量为系数,对列向量进行线性组合,结果即为
b
\boldsymbol{b}
b。形式化表示为:
A
x
=
x
1
⋅
a
1
+
x
2
⋅
a
2
+
⋯
+
x
n
⋅
a
n
=
b
\boldsymbol{A}\boldsymbol{x} = x_1 \cdot \boldsymbol{a}_1 + x_2 \cdot \boldsymbol{a}_2 + \dots + x_n \cdot \boldsymbol{a}_n = \boldsymbol{b}
Ax=x1⋅a1+x2⋅a2+⋯+xn⋅an=b
其中
a
k
=
[
A
1
k
A
2
k
⋮
A
m
k
]
\boldsymbol{a}_k = \begin{bmatrix} A_{1k} \\ A_{2k} \\ \vdots \\ A_{mk} \end{bmatrix}
ak=
A1kA2k⋮Amk
(
A
\boldsymbol{A}
A 的第
k
k
k 列列向量),
x
k
x_k
xk 为
x
\boldsymbol{x}
x 的第
k
k
k 个分量。
以
A
=
[
1
2
2
3
]
,
x
=
[
−
1
3
]
\boldsymbol{A} = \begin{bmatrix} 1 & 2 \\ 2 & 3 \end{bmatrix}, \boldsymbol{x} = \begin{bmatrix} -1 \\ 3 \end{bmatrix}
A=[1223],x=[−13] 为例:
A
x
=
(
−
1
)
⋅
[
1
2
]
+
3
⋅
[
2
3
]
=
[
−
1
+
6
−
2
+
9
]
=
[
5
7
]
=
b
\boldsymbol{A}\boldsymbol{x} = (-1) \cdot \begin{bmatrix} 1 \\ 2 \end{bmatrix} + 3 \cdot \begin{bmatrix} 2 \\ 3 \end{bmatrix} = \begin{bmatrix} -1 + 6 \\ -2 + 9 \end{bmatrix} = \begin{bmatrix} 5 \\ 7 \end{bmatrix} = \boldsymbol{b}
Ax=(−1)⋅[12]+3⋅[23]=[−1+6−2+9]=[57]=b
2.2 列图像的几何直观:线性组合的可视化
列图像的本质是将“列向量线性组合得到 b \boldsymbol{b} b”的过程可视化。以上述示例为例,其几何意义如下:
- 列向量 a 1 = [ 1 2 ] \boldsymbol{a}_1 = \begin{bmatrix} 1 \\ 2 \end{bmatrix} a1=[12](红色虚线向量)经数乘 − 1 -1 −1 后,方向反向,得到 − 1 ⋅ a 1 = [ − 1 − 2 ] -1 \cdot \boldsymbol{a}_1 = \begin{bmatrix} -1 \\ -2 \end{bmatrix} −1⋅a1=[−1−2](红色实线向量);
- 列向量 a 2 = [ 2 3 ] \boldsymbol{a}_2 = \begin{bmatrix} 2 \\ 3 \end{bmatrix} a2=[23](蓝色向量)经数乘 3 3 3 后,长度伸展为原来的 3 倍,得到 3 ⋅ a 2 = [ 6 9 ] 3 \cdot \boldsymbol{a}_2 = \begin{bmatrix} 6 \\ 9 \end{bmatrix} 3⋅a2=[69];
- 将两个数乘后的向量相加(遵循向量加法的“三角形法则”),最终得到 b = [ 5 7 ] \boldsymbol{b} = \begin{bmatrix} 5 \\ 7 \end{bmatrix} b=[57](绿色向量)。
2.3 列向量的线性相关性与方程组可解性
列向量的线性相关性决定了“列向量线性组合能否覆盖整个目标空间”,进而决定方程组 A x = b \boldsymbol{A}\boldsymbol{x} = \boldsymbol{b} Ax=b 是否有解。
(1)线性相关与线性无关的定义
对于 R m \mathbb{R}^m Rm 中的 n n n 个列向量 a 1 , a 2 , … , a n \boldsymbol{a}_1, \boldsymbol{a}_2, \dots, \boldsymbol{a}_n a1,a2,…,an:
- 若存在不全为零的常数 k 1 , k 2 , … , k n k_1, k_2, \dots, k_n k1,k2,…,kn,使得 k 1 a 1 + k 2 a 2 + ⋯ + k n a n = 0 k_1\boldsymbol{a}_1 + k_2\boldsymbol{a}_2 + \dots + k_n\boldsymbol{a}_n = \boldsymbol{0} k1a1+k2a2+⋯+knan=0,则称这 n n n 个列向量 线性相关;
- 若仅当 k 1 = k 2 = ⋯ = k n = 0 k_1 = k_2 = \dots = k_n = 0 k1=k2=⋯=kn=0 时上式成立,则称列向量 线性无关。
几何上,二维空间中两个列向量线性相关等价于“两向量共线”(方向相同或相反);三维空间中三个列向量线性相关等价于“三向量共面”。
(2)列向量线性无关的充要条件与方程组可解性
核心结论:若系数矩阵 A \boldsymbol{A} A 的列向量 全部线性无关,则对任意 b ∈ R m \boldsymbol{b} \in \mathbb{R}^m b∈Rm,方程组 A x = b \boldsymbol{A}\boldsymbol{x} = \boldsymbol{b} Ax=b 必有解。
原因如下:线性无关的列向量其线性组合可“充满”整个目标空间(如二维空间中,不共线的两个向量可组合出平面内所有向量;三维空间中,不共面的三个向量可组合出空间内所有向量)。因此,任意 b \boldsymbol{b} b 均可由这些列向量的线性组合表示,即存在对应的 x \boldsymbol{x} x 满足 A x = b \boldsymbol{A}\boldsymbol{x} = \boldsymbol{b} Ax=b。
若列向量线性相关(如二维空间中两向量共线),则其线性组合仅能覆盖一条直线(无法充满整个平面):
- 若 b \boldsymbol{b} b 在这条直线上,则方程组有解(无穷多解);
- 若 b \boldsymbol{b} b 不在这条直线上,则方程组无解。
2.4 行向量与列向量线性相关性的一致性
对于任意矩阵 A \boldsymbol{A} A,其行向量的线性相关性与列向量的线性相关性具有 一致性:
- 若 A \boldsymbol{A} A 的行向量全部线性无关,则其列向量也全部线性无关;
- 若 A \boldsymbol{A} A 存在线性相关的行向量,则其列向量也存在线性相关。
例如:
- 矩阵 A = [ 1 2 2 4 ] \boldsymbol{A} = \begin{bmatrix} 1 & 2 \\ 2 & 4 \end{bmatrix} A=[1224] 的行向量线性相关(第二行是第一行的 2 倍),列向量也线性相关(第二列是第一列的 2 倍);
- 矩阵 A = [ 1 2 2 3 ] \boldsymbol{A} = \begin{bmatrix} 1 & 2 \\ 2 & 3 \end{bmatrix} A=[1223] 的行向量线性无关,列向量也线性无关。
这一一致性是后续“矩阵秩”概念的核心基础(矩阵的行秩等于列秩)。
3. 解空间的维度与自由度
方程组解空间的维度(如直线、平面)本质是“自由度”的体现——自由度即“确定解所需独立变量的个数”,解空间的维度等于自由度。
3.1 自由度与解空间维度的关系
以方程对应的解空间为例:
- 二元一次方程 y = a x + b y = ax + b y=ax+b(或 a x + b y + c = 0 ax + by + c = 0 ax+by+c=0):确定解 ( x , y ) (x,y) (x,y) 时,只需任意指定 x x x 的值,即可唯一确定 y y y 的值,因此 自由度为 1,解空间为 1 维(直线);
- 三元一次方程 z = a x + b y + c z = ax + by + c z=ax+by+c(或 a x + b y + c z + d = 0 ax + by + cz + d = 0 ax+by+cz+d=0):确定解 ( x , y , z ) (x,y,z) (x,y,z) 时,需任意指定 x x x 和 y y y 的值,即可唯一确定 z z z 的值,因此 自由度为 2,解空间为 2 维(平面);
- n n n 元一次方程:自由度为 n − 1 n-1 n−1,解空间为 n − 1 n-1 n−1 维(超平面)。
本质上,方程的作用是“约束一个维度”,使原
n
n
n 维空间的解空间降维为
n
−
1
n-1
n−1 维。
由上述方程可知,其中一个维度的取值(一个未知变量对应一个维度,如前文的
y
y
y 和
z
z
z 可由其余两个维度的取值(对应未知变量)唯一确定。当其余两个维度对应的未知变量取值确定时,该维度的取值也随之确定,即此维度不具备自由度。
具体而言,前文两个方程中:
- 二元一次方程的自由度为 1;
- 三元一次方程的自由度为 2。
从空间维度与自由度的对应关系来看:
- 二维空间的自由度为 2;
- 三维空间的自由度为 3。
而上述方程对应的自由度(1 和 2)均低于其所在空间的自由度,因此方程的解空间发生维度退化(简称“降维”):
- 二元一次方程的解空间退化为自由度为 1 的空间,几何形态表现为一条直线;
- 三元一次方程的解空间退化为自由度为 2 的空间,几何形态表现为一个平面。
3.2 自由度与方程组解的个数
方程组解的个数由“所有方程约束后的总自由度”决定:
- 若总自由度为 0(如两个不平行的二元一次方程,约束两个维度),则解空间为 0 维(一个点),方程组有唯一解;
- 若总自由度为 k > 0 k > 0 k>0(如两个重合的二元一次方程,仅约束一个维度),则解空间为 k k k 维(一条直线或平面),方程组有无穷多解;
- 若方程之间存在矛盾(如两个平行的二元一次方程),则无满足所有约束的解,方程组无解。
4. 最后
本文通过行图像与列图像的双视角,揭示了矩阵的几何意义与方程组可解性的核心逻辑,关键结论可概括为:
- 行图像:方程组的解是各方程对应解空间(直线、平面或超平面)的交集,解的存在性由行向量的线性相关性决定;
- 列图像:矩阵乘法 A x = b \boldsymbol{A}\boldsymbol{x} = \boldsymbol{b} Ax=b 是列向量的线性组合,解的存在性由列向量的线性相关性决定;
- 一致性:矩阵的行向量与列向量线性相关性一致,这是“矩阵秩”的核心属性。
上述提到的方程组是否一定有解、维度、矩阵的秩(rank,反映线性无关向量的最大个数)以及矩阵是否可逆(方程组有唯一解的特殊情形),都是有相关性的。
via:
-
MIT线性代数笔记一 行图像和列图像_为什么行图和列图维度不一样-CSDN博客
https://blog.csdn.net/herosunly/article/details/88698381- ref
- Gilbert Strang. Introduction to Linear Algebra (5th Edition). Wellesley-Cambridge Press.
- David C. Lay. Linear Algebra and Its Applications (5th Edition). Pearson.
- deep learning - Hung-yi Lee
https://speech.ee.ntu.edu.tw/~tlkagk/courses_ML19.html - 麻省理工 线性代数 (MIT 18.06, Linear Algebra, Gilbert Strang)【中英】_bilibili
https://www.bilibili.com/video/av34573725/ - 哈尔滨工业大学 矩阵分析 全72讲 主讲-严质彬 视频教程_bilibili
https://www.bilibili.com/video/av11355346/
- ref
-
MIT—线性代数笔记01 行图像和列图像 - 知乎
https://zhuanlan.zhihu.com/p/45708880 -
矩阵的几何意义(行图像和列图像) - 知乎
https://zhuanlan.zhihu.com/p/618370114