2022-01-27-线性代数及其应用

前言

由于之后需要大量使用线性代数的知识,又时时感到自己在这方面的不足,所以最近复习了一下线代。

看了《Introduction to Linear Algebra》的前几章和《线性代数及其应用》的大部分章节,感觉这两本经典教材确实对理解线性代数有很大帮助;另外,youtube/bilibili上3Blue1Brown的视频也是很好的参考。

对《线性代数及其应用》中的部分章节做了一个总结。

第1章 线性代数中的线性方程组

1.1 线性方程组

线性方程组的解有下列三种情况:

  1. 无解。
  2. 有唯一解。
  3. 有无穷多解。

系数矩阵、增广矩阵(以为例,系数矩阵为,增广矩阵为右侧加一列)。

1.2 行化简与阶梯形矩阵

初等行变换、高斯消去法。

1.3 向量方程

向量的线性组合。

1.4 矩阵方程Ax=b

线性方程组的解的理解:

  • 列的角度:矩阵各列的线性组合。
  • 行的角度:各行代表的超平面求交。

1.5 线性方程组的解集

齐次线性方程组:可以写成的线性方程组。对于这样的方程来说至少有一个解:,称为平凡解,其它解称为非平凡解。

非齐次线性方程组:特解加上齐次线性方程组的解。

1.6 线性方程组的应用

1.7 线性无关

线性无关:只有平凡解则称A的各列向量线性无关。

1.8 线性变换介绍

定义:

对于任意矩阵,变换都是线性变换。

1.9 线性变换的矩阵

1.10 商业、科学和工程中的线性模型

第2章 矩阵代数

2.1 矩阵运算

矩阵,矩阵,的列是,则乘积矩阵,它的各列是,即:

矩阵乘法性质:

矩阵转置性质:

2.2 矩阵的逆

一个矩阵是可逆的,若存在一个矩阵使,则称的逆,逆是唯一的,不可逆矩阵称为奇异矩阵

是可逆矩阵,则对每一中的,方程有唯一解

是可逆矩阵,则也可逆且;若都是可逆矩阵,则也可逆,且;若可逆则也可逆,且

矩阵是可逆的,当且仅当行等价于,这时,把化简为的一系列初等行变换同时把变成

2.3 可逆矩阵的特征

矩阵,则下列命题等价。

  • 是可逆矩阵。
  • 行等价于
  • 个主元位置。
  • 仅有平凡解。
  • 的各列线性无关。
  • 线性变换一对一的。
  • 中任意,方程至少有一个解。
  • 的各列生成
  • 映射到
  • 存在矩阵使
  • 存在矩阵使
  • 是可逆矩阵。

2.4 分块矩阵

分块矩阵的乘法:将每个分块当作一个元素,进行矩阵乘法运算。

2.5 矩阵因式分解

LU分解:设矩阵,它可以行化简为阶梯形而不必行对换,则可写成形式下三角矩阵,主对角线元素全是1,的一个阶梯形矩阵。

LU分解后简化了线性方程组的求解。

2.6 列昂惕夫投入产出模型

2.7 计算机图形学中的应用

2.8 的子空间

中的一个子空间中的集合,具有以下三个性质:

  1. 零向量属于
  2. 中任意的向量,向量属于
  3. 中任意的向量和实数,向量属于

矩阵的列空间和零空间。

2.9 维数与秩

矩阵的秩是的列空间的维数。

矩阵,是可逆矩阵与等价。

第3章 行列式

3.1 行列式介绍

行列式定义:矩阵,的行列式为:

其中是将序列的元素交换次得到的一个序列。

三角阵的行列式等于主对角线元素乘积。

3.2 行列式的性质

是一个方阵:

  1. 的某一行的倍数加到另一行得矩阵,则
  2. 的某两行互换得矩阵,则
  3. 的某一行的乘以得到矩阵,则

方阵是可逆的当且仅当

方阵的转置的行列式与的行列式相等。

方阵乘积的行列式等于行列式的乘积,但一般和的行列式不等于行列式的和。

3.3 克拉默法则、体积和线性变换

研究,将的第列用替换得到

克拉默法则:设是一个可逆的矩阵对于中的任意向量,方程的唯一解可由下式给出:

2阶方阵的行列式的绝对值等于由它的列确定的平行四边形的面积,3阶矩阵的行列式的绝对值等于由它的列确定的平行六面体的体积。

2/3阶方阵确定的线性变换作用于平行四边形/平行六面体的到的面积/体积改变倍数等于行列式的绝对值。

第4章 向量空间

4.1 向量空间与子空间

4.2 零空间、列空间和线性变换

4.3 线性无关集和基

4.4 坐标系

4.5 向量空间的维数

4.6 秩

4.7 基的变换

4.8 差分方程中的应用

4.9 马尔可夫链中的应用

第5章 特征值与特征向量

5.1 特征向量与特征值

矩阵,为非零向量,若存在数使有非平凡解,则称的特征值,称为对应于的特征向量。

的特征值当且仅当有非平凡解。矩阵的零空间称为的对应于特征空间

三角阵主对角线元素是其特征值。

特征向量集合线性无关。

5.2 特征方程

方阵是可逆的当且仅当0不是的特征值。

称为特征方程

矩阵的特征值的充要条件是是特征方程的根。

次多项式,称为特征多项式。把特征值在特征方程中的重数称为(代数)重数

矩阵,如果存在可逆矩阵,使得,则称是相似的,把变成的变换称为相似变换。若是相似的,那么它们有相同的特征多项式,从而有相同的特征值(和相同的重数)。

5.3 对角化

矩阵可对角化的充分必要条件是个线性无关的特征向量。

事实上,为对角矩阵的充分必要条件是的列向量是个线性无关的特征向量,此时,的主对角线上的元素分别是的对应与中特征向量的特征值。

换句话说,可对角化的充分必要条件是有足够的特征向量形成 的基,我们称这样的基为特征向量基

个相异特征值的的矩阵可对角化。

5.4 特征向量与线性变换

5.5 复特征值

5.6 离散动力系统

5.7 微分方程中的应用

5.8 特征值的迭代估计

第6章 正交性和最小二乘法

6.1 内积、长度和正交性

中向量之间的距离记为,表示向量的长度,即:

正交即内积为0。

如果向量的子空间中任意向量都正交,则称正交于,全体组成的集合称为正交补,并记作

矩阵,那么的行空间的正交补是A的零空间,且的列空间的正交补是的零空间。

6.2 正交集

任意两个不同向量都正交的集合称为正交集。

如果是由中非零向量构成的正交集,那么是线性无关集,因此构成所生成的子空间的一组基。

假设中子空间的正交基,对中的每个向量,线性组合中的权可以由计算。

一个矩阵具有单位正交列向量的充分必要条件是正交矩阵是指转置等于逆的矩阵,正交矩阵具有单位正交列向量。

假设是一个具有单位正交列的矩阵,且中的向量,那么:

  1. 的充分必要条件是

6.3 正交投影

正交投影是子空间内部对子空间外一个向量的最佳逼近。

6.4 格拉姆-施密特方法

格拉姆-施密特方法是对中任何非零子空间构造正交基或标准正交基的简单算法。

对于的子空间的一个基,定义

那么的一个正交基,标准正交基就是单位化的正交基。

如果矩阵的列线性无关,那么应用格拉姆-施密特方法(包含单位化)于等同于对A做

如果矩阵列线性无关,那么可以分解为,其中是一个矩阵,其列形成的列空间的一个标准正交基,是一个上三角可逆矩阵且在对角线上的元素为正数。

6.5 最小二乘问题

如果矩阵和向量属于,则最小二乘解中的,使得对于所有成立。一般对于无解的巨型线性方程组考虑用最小二乘法。

最小二乘法就是寻找的列空间中最接近的点。

方程的每个最小二乘解集和法方程的非空解集一致。称为的法方程,这个法方程的解用表示。

对于矩阵,下列命题是等价的:

  • 对于中的每个,方程有唯一的最小二乘解。
  • A的列是线性无关的。
  • 矩阵是可逆的。

当这些条件成立时,

对于矩阵,它具有线性无关的列,取是它的QR分解,那么对于每一个属于,方程有唯一的最小二乘解,其解为

6.6 线性模型中的应用

6.7 内积空间

6.8 内积空间的应用

第7章 对称矩阵和二次型

7.1 对称矩阵的对角化

如果是对称矩阵,那么不同特征空间的任意两个特征向量是正交的。

一个矩阵正交对角化的充分必要条件是是对称矩阵。

谱定理:一个对称的矩阵具有下述性质:

  1. 各实特征值,包含重复的特征值。
  2. 对每一个特征值,对应的特征空间的维数等于作为特征方程的根的重数。
  3. 特征空间互相正交,这种正交性是在特征向量对应于不同特征值意义下成立的。
  4. 可正交对角化。

谱分解:假设,其中的列是的单位正交特征向量,且相应的特征值属于对角矩阵,那么由于,故

由于它将分解为由的谱(特征值)确定的小块,因此这个的表示就称为的谱分解。式中的每一项都是一个秩为1的矩阵。

7.2 二次型

上的一个二次型是一个定义在上的函数,它在向量处的值可由表达式计算,其中是一个对称矩阵,矩阵称为关于二次型的矩阵

二次型的交叉乘积项可以通过用适当的变量代换来消去。

主轴定理:设是一个对称矩阵,那么存在一个正交变量代换,它将二次型变换为不含交叉乘积项的二次型的列称为二次型的主轴。

二次型的分类:一个二次型是:

  1. 正定的,如果对于所有,有
  2. 负定的,如果对于所有,有
  3. 不定的,如果既有正值又有负值。
  4. 半正定的,如果对于所有,有
  5. 半负定的,如果对于所有,有

二次型与特征值(矩阵的正定性同理):设是一个对称矩阵,那么一个二次型是:

  1. 正定的,当且仅当的所有特征值是正数。
  2. 负定的,当且仅当的所有特征值是负数。
  3. 不定的,当且仅当既有正特征值,又有负特征值。
  4. 半正定的,当且仅当的所有特征值是非负数。
  5. 半负定的,当且仅当的所有特征值是非正数。

7.3 条件优化

7.4 奇异值分解

不是所有矩阵都能分解成,且是对角的。但是分解对于任何矩阵都有可能,奇异值分解(SVD)。

涉及了条件数、伪逆等。

7.5 图像处理和统计学中的应用

第8章 向量空间的几何学

8.1 仿射组合

一个向量的仿射组合是线性组合的一种特殊形式,给定中向量(或“点”)和标量的一个仿射组合是线性组合,其权值满足

集合中的所有仿射组合的集合称为仿射包(或仿射生成集),记为

中一个点的一个仿射组合,当且仅当是平移点的线性组合。

如果对任意实数,由得出,则集合仿射的。

当且仅当中点的每一个仿射组合都属于,集合是仿射的。即当且仅当是仿射的。

8.2 仿射无关性

中的一个指标点集,如果存在不全为0的实数,使得则称指标点集是仿射相关的,否则仿射无关。

8.3 凸组合

(各分量均)非负线性组合为凸组合。

一个集合中所有凸组合的集称为集合的凸包。

集合是凸的,若对于每个,线段中。

集合是凸集当且仅当中的点的凸组合在中。

8.4 超平面

超平面是指维线性空间中维度为的子空间,由非零线性函数等于常数表达。

超平面将一个空间分为不相交的两个半空间。

8.5 多面体

8.6 曲线和曲面