sklearn聚类
在此将sklearn官网的一张关于聚类算法比较的图片放过来。
下面的表格是根据sklearn官网翻译而来。
方法名称 | 参数 | 可扩展性 | 应用场景 | 几何度量(距离) |
---|---|---|---|---|
MiniBatchKMeans | 簇的数量 | 非常适合处理大量样本和中等数量的簇(使用MiniBatch时) | 通用型,适用于簇大小均匀、几何形状平坦、簇数量不太多的情况,归纳式 | 点与点之间的距离 |
亲和力传播聚类 | 阻尼系数、样本偏好 | 不适合处理大量样本 | 适用于簇数量多、簇大小不均匀、非平坦几何形状的情况,归纳式 | 图距离(如最近邻图) |
均值漂移聚类 | 带宽 | 不适合处理大量样本 | 适用于簇数量多、簇大小不均匀、非平坦几何形状的情况,归纳式 | 点与点之间的距离 |