SVM

发布时间 2023-06-27 09:53:58作者: SscDc

要解决的问题:什么样的决策边界才是最好的?

        将红蓝两类数据分隔开来的直线称为分隔超平面,在高维数据集中,将数据分隔开来的对象称为超平面,也就是分类的决策平面,蓝色圆圈标记的数据点,也就是距离分隔超平面最近的那些点,称为支持向量(support vecto


        通过非线性映射将数据映射到一个足够高的维度,来自两个类别的数据总可以被一个超平面分割,SVM寻找一个满足要求的超平面,并且使得训练集中的点距离分类面尽可能的远,也就是寻找一个分类面使得它两侧的空白区域(margin)最大。

        两类样本中离分类面最近的点且平行于最优分类面的超平面上的训练样本,称为支持向量SVM使用支持向量来发现超平面。 wx+b=0 即为分离超平面,几何间隔最大的分离超平面却是唯一的。