当前位置: 首页 > news >正文

Sklearn 机器学习 数据聚类 肘部法则选择聚类数目

💖亲爱的技术爱好者们,热烈欢迎来到 Kant2048 的博客!我是 Thomas Kant,很开心能在CSDN上与你们相遇~💖

在这里插入图片描述

本博客的精华专栏:
【自动化测试】 【测试经验】 【人工智能】 【Python】


在这里插入图片描述

Sklearn 机器学习:数据聚类中的肘部法则(Elbow Method)选择最佳聚类数目

在无监督学习中,聚类(Clustering) 是一项常见任务,而确定最优的聚类数目始终是聚类算法中的一个关键挑战。

本篇博文将围绕 SklearnKMeans 实践,详细讲解如何通过 肘部法则(Elbow Method) 辅助选择合理的聚类数目。

我们将覆盖如下内容:

  • 肘部法则的原理与直觉解释
  • Sklearn + KMeans + Elbow Method 实战代码
  • 自动寻找拐点与多指标辅助判断
  • 方法局限性与补充建议

🔍 一、什么是肘部法则(Elbow Method)?

原理简介

KMeans 聚类中,我们需要提前指定聚类数目 k。不同的 k 会产生不同的聚类结果,我们可以通过 样本到其所属簇中心的距离平方和 来衡量聚类效果。

这个距离平方和被称为:

簇内平方和(Within-Cluster Sum of Squares, WCSS),也常被称为 SSE(Sum of Squared Errors)。
Sklearn 中 KMeansinertia_ 属性就是该值的计算结果,默认使用欧氏距离作为度量方式。

随着聚类数 k 的增加,WCSS 会不断减小,但下降的幅度会逐渐趋缓。此时在曲线上出现“陡降 → 平缓”的拐点,即所谓的“肘部(Elbow)”,通常被视为最优聚类数

示意图理解

我们可以绘制如下图所示的折线图,x轴为聚类数 k,y轴为 SSE 值:

SSE│          ●│        ●│      ●│    ●│   ●└────────────────────► k1  2  3  4  5 ...↘ 肘部位置

从图中寻找“SSE 降低幅度明显变缓的点”,就是肘部位置。

⚠️ 注意:当数据聚类结构不明显或维度较高时,肘部可能难以辨识,后文将介绍自动检测方法和其他指标辅助。


🛠️ 二、Sklearn 实战:肘部法则选择聚类数

以下是完整的代码示例,我们使用 make_blobs 构造数据集,并通过肘部法则绘图选择合适的聚类数。

1. 导入必要库

import matplotlib.pyplot as plt
from sklearn.cluster import KMeans
from sklearn.datasets import make_blobs

2. 构造数据集

http://www.dtcms.com/a/314687.html

相关文章:

  • 二叉树的概念以及二叉树的分类,添加,删除
  • 机器学习通关秘籍|Day 02:特征降维、用KNN算法和朴素贝叶斯实现分类
  • MySql的两种安装方式
  • AI编程助手:终结996的新希望
  • (论文速读)关注特征细化的图像恢复自适应稀疏变换
  • mac 锁屏不断网 2025
  • C++进阶-封装红黑树模拟实现map和set(难度较高)
  • 量子计算接口开发:Python vs Rust 性能对决
  • 前端控制台看样式
  • Flask 项目 Windows 服务器部署全流程
  • 特征降维实战:高效选择关键特征
  • [Oracle] TO_CHAR()函数
  • PandasAI连接LLM对MySQL数据库进行数据分析
  • 衡石科技HENGSHI SENSE 6.0:技术架构全面革新,开启智能分析新纪元
  • 【Pytorch✨】神经网络训练分类器
  • 分布式光伏气象站:为分散电站装上 “智慧之眼”
  • 我的创作纪念日____在 CSDN一年来的成长历程和收获
  • 【2025-08-04 Java学习小记】
  • vxe-table 实现列个性化自定义列功能,自动记忆用户的操作列状态,完整的详细教程
  • 【学习笔记】Manipulate-Anything(基于视觉-语言模型的机器人自动化操控系统)
  • 系统信息及进程管理命令
  • 【0基础3ds Max】常用快捷键
  • Planner 5D v2.29.0 安卓高级解锁版,手机3D家装,全套家具免费
  • [3D数据存储] Archive (File Container) | 创建/写入/读取 | 存储格式HDF5
  • SpringMVC 6+源码分析(三)DispatcherServlet实例化流程 2--(url 与contrller类如何进行映射)
  • 人工智能开发框架 10. MNIST手写数字识别任务(三)
  • 补:《每日AI-人工智能-编程日报》--2025年7月27日
  • STM32 串口收发HEX数据包
  • 汇川PLC通过ModbusTCP转Profinet网关连接西门子PLC配置案例
  • Linux Epool的作用