机器学习-矩阵

发布时间 2024-01-09 23:09:43作者: 宜家数据小哥

1、名称解释

(1)什么是矩阵的转秩?

  矩阵的转置是指将一个矩阵的行列互换得到的新矩阵。例如,对于一个m×n的矩阵A,其转置记作A^T,得到的新矩阵的维度为n×m。转置矩阵的第i行第j列元素等于原矩阵的第j行第i列元素。

(2)什么是单位阵?

  单位阵(Identity matrix),也称为单位矩阵或恒等矩阵,是一个方阵,其主对角线上的元素全为1,而其它位置的元素全为0。单位阵通常用字母I表示。

  单位阵具有以下性质:

  1. 单位阵的行数等于列数,即它是一个n×n的方阵。
  2. 单位阵与任意一个相同维度的矩阵相乘,都会得到原矩阵本身。即对于任意n×m的矩阵A,有AI = IA = A。
  3. 单位阵的转置等于它本身,即I^T = I。

(3)什么是迹(trace)?

  矩阵的迹(trace)是指一个方阵主对角线上元素的和。对于一个n×n的矩阵A,其迹记作tr(A)或者Tr(A)。

  具体地说,如果

A = [a₁₁ a₁₂ ... a₁ₙ
a₂₁ a₂₂ ... a₂ₙ
... ... ...
aₙ₁ aₙ₂ ... aₙₙ]

  那么 A 的迹就是 tr(A) = a₁₁ + a₂₂ + ... + aₙₙ。

  迹在矩阵运算和线性代数中有一些重要的性质:

  1. 迹与矩阵的转置无关,即 tr(A) = tr(A^T)。
  2. 迹与矩阵的乘法具有可交换性,即对于两个矩阵 A 和 B,有 tr(AB) = tr(BA)。
  3. 对于任意矩阵 A、B 和 C,满足相容性的条件下,有 tr(A + B + C) = tr(A) + tr(B) + tr(C)。

(4)什么是行列式(determinant)?

  行列式(determinant)是一个与方阵相关的数值。对于一个n×n的方阵A,它的行列式记作det(A)、|A|或者Δ。

  具体地说,如果 

A = [a₁₁ a₁₂ ... a₁ₙ
a₂₁ a₂₂ ... a₂ₙ 
... ... ... 
aₙ₁ aₙ₂ ... aₙₙ]

  那么 A 的行列式可以通过递归定义来计算。当矩阵为1×1时,行列式就是该元素的值。当矩阵为2×2时,行列式的计算公式为 ad - bc,其中 a、b、c、d 分别为矩阵的四个元素。对于更高维度的矩阵,行列式的计算涉及到一系列代数运算,超出了简单的介绍范围。

  行列式在线性代数中具有重要的性质和应用:

  1. 行列式可以判断矩阵是否可逆。如果一个方阵的行列式不等于零,那么它是可逆的;如果行列式等于零,那么它是奇异的,不可逆。
  2. 行列式可以计算矩阵的特征值。特征值是线性代数中的一个重要概念,它描述了矩阵变换后向量的伸缩倍数。
  3. 行列式可以计算矩阵的伴随矩阵和逆矩阵。伴随矩阵和逆矩阵在矩阵的求解、线性方程组的求解等问题中起着关键的作用。

(5)什么是逆矩阵?

  逆矩阵(inverse matrix)是在线性代数中与方阵相关的概念。对于一个n×n的方阵A,如果存在另一个方阵B,满足 AB = BA = I,其中I表示单位阵,则称B为A的逆矩阵,记作A⁻¹。

  换句话说,矩阵A的逆矩阵存在的条件是,通过与某个矩阵相乘后能够得到单位阵,并且这个矩阵的顺序与逆序相乘都得到单位阵。

  逆矩阵具有以下性质:

  1. 如果A的逆矩阵存在,则A是可逆的,也称为非奇异矩阵。
  2. 如果A的逆矩阵存在,则其逆矩阵唯一。
  3. 如果A和B都是可逆矩阵,则AB也是可逆矩阵,并且(AB)⁻¹ = B⁻¹A⁻¹。
  4. 如果A是可逆矩阵,则(A⁻¹)⁻¹ = A。

(6)什么是L1范数?

  在数学和工程领域,L1范数是指向量中各个元素绝对值之和。对于一个n维向量x,它的L1范数表示为:

||x||1 = |x₁| + |x₂| + ... + |xn|
其中|x₁|、|x₂|、...、|xn|为向量x中各个元素的绝对值。

  L1范数也称作曼哈顿范数(Manhattan norm),因为它可以被看作是从原点到向量终点沿坐标轴方向所走的距离之和,类似于纽约市的曼哈顿街区之间的距离。因此,在某些领域,L1范数也被称作“街区距离”(taxicab distance)。

(7)什么是L2范数?

  在数学和工程领域,L2范数是指向量中各个元素平方和的平方根。对于一个n维向量x,它的L2范数表示为:

||x||2 = √(x₁² + x₂² + ... + xn²)
其中x₁²、x₂²、...、xn²为向量x中各个元素的平方。

  L2范数也称作欧氏范数(Euclidean norm),因为它可以被看作是向量的欧氏距离,即从原点到向量终点的直线距离。

2、基本演算