正则化-526互联

什么是正则化

在机器学习中，一个核心问题是设计不仅在训练数据集上表现好，而且能在新输入上有好的泛化性，因此许多策略被显式地设计来减少测试误差，这些策略统称为正则化。

因此，正则化被定义为对学习算法地修改-减少泛化误差而不是训练误差。也就是说，正则化的目的是防止模型过拟合，降低泛化误差，提高泛化能力。

正则化方法则是在模型参数上施加约束，添加惩罚项。假设模型的目标函数如下

\[\tilde{J}(\theta ; X, y)=J(\theta ; X, y)+\alpha \Omega(\theta) \]

这里α是超参数，用于控制正则化的力度，\(\Omega(θ)\)表示正则项。

将空间中两个点的距离这个概念给扩展一下就是范数。

对目标函数施加L1正则化，则上述公式正则项表示为

\[\Omega(\theta)=\sum|\theta| \]

可以对深度模型按层进行L1正则化

对目标函数施加L2正则化，则公式中的正则项表示为

\[\Omega(\theta)=\sum \theta^2 \]

可以对深度模型按层进行L2正则化