【机器学习】自动微分-526互联

标量变量的反向传播

以下举两个例子说明标量变量的反向传播如何实现。

非标量变量的反向传播

在上述的例子中，x 是向量，而 y 是标量，这种类型为标量变量的反向传播。

但当 y 不是标量时，比如 y = x * x，当求向量 y 关于另一个向量 x 的导数时，结果通常就是一个矩阵，被称为雅可比矩阵，或者是微分矩阵。这时候就是非标量变量的反向传播了。

对于非标量函数，我们仍然将导数视为雅可比矩阵。但在实际计算中，通常是对批量中的每个样本的导数进行求和，来进行参数更新。