0010.有监督学习之K-均值聚类
发布时间 2023-06-09 11:55:36作者: 興華
一、聚类分析概述
1. 簇的定义
2. 常用的聚类算法
二、K-均值聚类算法
1. K-均值算法的python实现
1.1 导入数据集
1.2 构建距离计算函数
1.3 编写自动生成随机质心的函数
1.4 编写K-Means聚类函数
2. 算法验证
3. 误差平方和SSE计算
三、模型收敛稳定性探讨
四、二分K-均值算法
1. 二分K均值的python实现
1.1 数据准备
1.2 构建辅助函数
1.3 构建二分K均值函数
五、聚类模型的评价指标
1. 误差平方和SSE
2. 轮廓系数
2.1 凝聚度和分离度
2.2 凝聚度和分离度的基本性质
2.3 轮廓系数
3. 轮廓系数的python实现
【附录1】聚类类模型中距离的确定
【附录2】归一化方法