当前位置: 首页 > news >正文

轮廓系数(一个异型簇的分类标准)

定义

轮廓系数是“簇内紧密性” 和 “簇间分离度” 量化聚类效果,取值范围为 [-1, 1],越接近 1 表示聚类质量越好。

簇内紧密性:指的该样本到同簇内距离的平均值

簇间分离度:指的是最小化(该样本到每个异簇的距离的平均值)

公式

# 弹性网络损失函数

ElasticNet融合L1和L2惩罚,损失函数为:

样本 i  的轮廓系数 } s 公式为

$$

s= \begin{cases} 1 - \dfrac{a_i}{b_i}, & \text{若 } a_i < b_i \ (\text{簇内紧、簇间远,聚类好}) \\ 0, & \text{若 } a_i = b_i \ (\text{簇内与簇间距离相当,聚类一般}) \\ \dfrac{a_i}{b_i} - 1, & \text{若 } a_i > b_i \ (\text{簇内松、簇间近,聚类差}) \end{cases}

$$

个人理解核心目标是最小化紧密型 最大化分离度

根据这个目标推算公式

全局轮廓系数就是所有轮廓系数的平均值

from sklearn.metrics import silhouette_samples,silhouette_scorescore = silhouette_score(X, cluster_labels)  # 计算全局轮廓系数# 4.3 计算所有样本的轮廓系数(包括新样本)sample_silhouettes = silhouette_samples(X_combined, labels_combined)# 4.4 提取新样本的轮廓系数(最后一个元素)new_sample_score = sample_silhouettes[-1]

总结

首先轮廓系数是可以作为聚类算法的评估指标,同样也可用二分法在大数据上进行优化

http://www.dtcms.com/a/495050.html

相关文章:

  • 把 1688 商品详情搬进 MySQL:PHP 爬虫全链路实战(2025 版)
  • python+uniapp基于微信小程序的个人物品租售系统
  • 中国(新疆)航空航天国防展--三款MEMS惯性导航系统解析
  • 十大拿货网站爱做奈官方网站
  • 图像处理之膨胀
  • AI部署001 - C++环境部署与服务器使用
  • MP4格式视频无法播放怎么修?4个修复方法,解决难题
  • 语音处理:音频移形幻影,为何大振幅信号也无声
  • dedecms学校网站模板wordpress 3d插件
  • 注册一个新公司需要多少钱seo如何进行优化
  • Git流程规范介绍
  • Python 第十五节 OS文件操作相关方法用途详解
  • 动态规划的“递归之舞”:破解字符串的深层结构——扰乱字符串
  • 淮北市做网站最好的公司上海网站搭建平台公司
  • 网站域名设计推荐新华网海南频道
  • InternVL3.5多模态多大模型改进点及视觉分辨率路由模块技术浅尝
  • 人工智能基础知识笔记十八:Prompt Engineering
  • 深入理解Shell与反弹Shell:从原理到实战
  • LangChain 基础系列之 Prompt 工程详解:从设计原理到实战模板_langchain prompt
  • EvalScope模型压力测试实战
  • 极速网站建设服务商厦门网站建设网络推广
  • 新建网站如何调试网页设计公司的调研
  • 模拟oracle 索引平衡树叶子节点
  • Android 内存优化
  • Java JVM “垃圾回收(GC)”面试清单(含超通俗生活案例与深度理解)
  • Python快速落地的临床知识问答与检索项目(2025年9月教学实现部分)
  • 从0到1掌握Spring Boot自动配置:自定义配置实战指南
  • 索引设计速查:哪些字段该建索引?哪些不能建?
  • 自己的主机做网站服务器小树建站平台
  • 英集芯-IP5385开发调试总结