深度学习笔记_Week1-526互联

本笔记基于吴恩达深度学习deeplearning.ai课程

第二周：神经网络的编程基础

神经网络的训练过程可以分为前向传播和反向传播两个独立的部分

2.1 二分类(Binary Classification)

所谓二分类问题，可以参照以下例子

假如你有一张图片作为输入，比如这只猫，如果识别这张图片为猫，则输出标签 1 作为结果；如果识别出不是猫，那么输出标签 0 作为结果。

在二分类问题中，目标就是习得一个分类器，它以图片的特征向量作为输入，然后预测输出结果 ? 为 1 还是 0

? = [? (1) , ? (2) , . . . , ? (?) ]：表示所有的训练数据集的输入值，放在一个 ?? × ?的矩阵中，其中?表示样本数目

? = [? (1) , ? (2) , . . . , ? (?) ]：对应表示所有训练数据集的输出值，维度为1 × ?。

用一对(?, ?)来表示一个单独的样本，?代表??维的特征向量，? 表示标签(输出结果)只能为 0 或 1。而训练集将由?个训练样本组成，其中(? (1) , ? (1) )表示第一个样本的输入和输出，(? (2) , ? (2) )表示第二个样本的输入和输出，直到最后一个样本(? (?) , ? (?) )，然后所有的这些一起表示整个训练集。

总的来说，?是一个规模为??乘以?的矩阵，?是一个规模为 1 乘以?的矩阵。

2.2 逻辑回归(Logistic Regression)

逻辑回归通过计算 y^ 来实现对实际值 y 的估计，一件可以尝试却不可行的事是让?^ = ??? + ? ，因为我们希望的 y^ 值域为0到1，故要使用sigmoid函数。

\[?(?) = 1/{1 + e^{-z}} \]

sigmoid函数很好地将所有的z值映射到 0 到 1 之间。

2.3 逻辑回归的代价函数（Logistic Regression Cost Function）

为什么需要代价函数：

为了训练逻辑回归模型的参数参数?和参数?我们，需要一个代价函数，通过训练代价函数来得到参数?和参数?。

损失函数：

损失函数又叫做误差函数，用来衡量算法的运行情况，Loss function:?(?^ , ?). 我们通过这个?称为的损失函数，来衡量预测输出值和实际值有多接近。一般我们用预测值和实际值的平方差或者它们平方差的一半，但是通常在逻辑回归中我们不这么做，因为梯度下降法很可能找不到全局最优值，在逻辑回归模型中会定义另外一个损失函数。我们在逻辑回归中用到的损失函数是：?(?^ , ?) = −?log(?^) − (1 − ?)log(1 − ?^)