K-Means聚类算法学习

发布时间 2023-11-29 14:55:16作者: Junior_bond

K-Means聚类算法的简介:

  聚类和分类算法的最大区别在于,分类的目标类别为已知(监督学习),而聚类的目标类别是未知的(无监督),即数据集无标签. K-Means算法(K_均值算法)就是无监督算法之一,与分类、序列标注等任务不同,聚类是在事先并不知道任何样本标签的情况下,通过数据之间的内在关系把样本划分为若干类别,使得同类别样本之间的相似度高,不同类别之间的样本相似度低(即增大类内聚,减少类间距). 简而言之,K-Means算法的原理就是对于给定的样本集,按照样本点之间的距离大小,将样本集划分为K个簇,设法让簇内的点尽量紧密的连在一起,而让簇间的距离尽量的大.