0010.有监督学习之K-均值聚类

发布时间 2023-06-09 11:55:36作者: 興華

一、聚类分析概述

1. 簇的定义

2. 常用的聚类算法

二、K-均值聚类算法

1. K-均值算法的python实现

1.1 导入数据集

1.2 构建距离计算函数

1.3 编写自动生成随机质心的函数

1.4 编写K-Means聚类函数

2. 算法验证

3. 误差平方和SSE计算

三、模型收敛稳定性探讨

四、二分K-均值算法

1. 二分K均值的python实现

1.1 数据准备

1.2 构建辅助函数

1.3 构建二分K均值函数

五、聚类模型的评价指标

1. 误差平方和SSE

2. 轮廓系数

2.1 凝聚度和分离度

2.2 凝聚度和分离度的基本性质

2.3 轮廓系数

3. 轮廓系数的python实现

【附录1】聚类类模型中距离的确定

【附录2】归一化方法