当前位置: 首页 > wzjs >正文

网站后期培训班一般要多少钱深圳专业o2o网站设计公司

网站后期培训班一般要多少钱,深圳专业o2o网站设计公司,网站建设需求表,安卓网站开发平台聚类算法 K-means 算法 算法原理 K-means 是一种基于类内距离最小化的划分式聚类算法,其核心思想是通过迭代优化将数据划分为 K 个簇。目标函数为最小化平方误差(SSE): S S E ∑ i 1 K ∑ x ∈ C i ∣ ∣ x − μ i ∣ ∣ 2…

聚类算法

K-means 算法

算法原理

K-means 是一种基于类内距离最小化的划分式聚类算法,其核心思想是通过迭代优化将数据划分为 K 个簇。目标函数为最小化平方误差(SSE):
S S E = ∑ i = 1 K ∑ x ∈ C i ∣ ∣ x − μ i ∣ ∣ 2 SSE = \sum_{i=1}^{K} \sum_{x \in C_i} ||x - \mu_i||^2 SSE=i=1KxCi∣∣xμi2
其中 μ i \mu_i μi 是第 i i i 个簇的质心。

算法步骤

  1. 初始化

    • 随机选择 K 个初始质心(或使用 k-means++ 优化初始化)
  2. 迭代优化

    • 分配阶段:将每个样本分配到距离最近的质心所属簇
      C i = { x : ∣ ∣ x − μ i ∣ ∣ 2 ≤ ∣ ∣ x − μ j ∣ ∣ 2 , ∀ j } C_i = \{ x : ||x - \mu_i||^2 \leq ||x - \mu_j||^2, \forall j \} Ci={x:∣∣xμi2∣∣xμj2,j}
    • 更新阶段:重新计算每个簇的质心
      μ i = 1 ∣ C i ∣ ∑ x ∈ C i x \mu_i = \frac{1}{|C_i|} \sum_{x \in C_i} x μi=Ci1xCix
  3. 终止条件

    • 质心位置不再变化(收敛)
    • 达到最大迭代次数
    • SSE 变化量小于阈值

特点

  • 时间复杂度: O ( n ∗ K ∗ I ∗ d ) O(n*K*I*d) O(nKId),n 为样本数,I 为迭代次数
  • 需预先指定 K 值
  • 对初始质心敏感,可能收敛到局部最优

DBSCAN 算法

算法原理

DBSCAN(Density-Based Spatial Clustering of Applications with Noise)是一种基于密度可达性的聚类算法,由Ester等人在1996年提出,其核心思想是通过数据点的局部密度分布识别聚类结构,并有效处理噪声。算法中的关键概念包括:

  1. 核心点:以某点为中心、半径ε邻域内的点数≥MinPts的点,是簇形成的基础。
  2. 边界点:位于核心点的ε邻域内,但自身邻域内点数<MinPts的点。
  3. 噪声点:既非核心点也非边界点的孤立点。
  4. 密度可达性:若点A通过一系列核心点间接可达点B,则称A与B密度可达。
  5. 密度连通性:若存在核心点O,使得点A和B均密度可达于O,则A与B密度连通。

算法步骤

  1. 初始化参数:设置邻域半径ε和最小密度阈值MinPts。
  2. 遍历未访问点:随机选择一个未访问点,计算其ε邻域内的点数:
    • 若点数<MinPts:标记为噪声点(可能后续被重新归类为边界点)。
    • 若点数≥MinPts:标记为核心点,创建新簇,递归合并所有密度可达点。
  3. 扩展聚类:通过核心点的邻域不断吸收边界点和可达核心点,直至无法扩展。
  4. 重复处理:遍历所有未访问点,直至数据集处理完毕。

特性

  • 时间复杂度:O(n log n)(使用空间索引时)
  • 可发现任意形状的簇
  • 自动识别噪声点
  • 对参数敏感

聚类评估指标

1. 轮廓系数 (Silhouette Coefficient)

综合衡量样本的簇内紧密度簇间分离度
s ( i ) = b ( i ) − a ( i ) max ⁡ { a ( i ) , b ( i ) } s(i) = \frac{b(i) - a(i)}{\max\{a(i), b(i)\}} s(i)=max{a(i),b(i)}b(i)a(i)

  • a ( i ) a(i) a(i):样本 i 到同簇其他点的平均距离
  • b ( i ) b(i) b(i):样本 i 到最近其他簇的平均距离
  • 取值范围:[-1, 1],值越大聚类质量越高

2. Calinski-Harabasz 指数

通过方差比评估聚类质量:
C H = t r ( B k ) / ( K − 1 ) t r ( W k ) / ( n − K ) CH = \frac{tr(B_k)/(K-1)}{tr(W_k)/(n-K)} CH=tr(Wk)/(nK)tr(Bk)/(K1)

  • B k B_k Bk:簇间协方差矩阵
  • W k W_k Wk:簇内协方差矩阵
  • 值越大表示簇间差异越大,簇内越紧密

K-means 的 K 值选择方法详解

肘部法则 (Elbow Method)

计算不同 K 值对应的 SSE:

sse = []
for k in range(1, 11):kmeans = KMeans(n_clusters=k)kmeans.fit(data)sse.append(kmeans.inertia_)

文章转载自:

http://X3cXZSGE.bkctL.cn
http://NeWIlm1z.bkctL.cn
http://haaNYcep.bkctL.cn
http://R16upnzu.bkctL.cn
http://oV6Q0nMu.bkctL.cn
http://q2P0Dky4.bkctL.cn
http://7DdcmAso.bkctL.cn
http://mpv8UgND.bkctL.cn
http://1lTORi7q.bkctL.cn
http://N4JhQ0Jb.bkctL.cn
http://oxG6ON9E.bkctL.cn
http://pk7hRAqB.bkctL.cn
http://X7MCtayA.bkctL.cn
http://LN4ujp6o.bkctL.cn
http://uLWXJL8P.bkctL.cn
http://v5qZdkDs.bkctL.cn
http://oeb0CsT9.bkctL.cn
http://Gal2aB1J.bkctL.cn
http://vziqEIAC.bkctL.cn
http://DUgg0TWm.bkctL.cn
http://Wp0NLxf8.bkctL.cn
http://7Fi5ywdc.bkctL.cn
http://8Nb6jcGP.bkctL.cn
http://sAbQJxHk.bkctL.cn
http://2VuomlHf.bkctL.cn
http://MeEZKavK.bkctL.cn
http://8RYr3F7H.bkctL.cn
http://96DQnKob.bkctL.cn
http://xASXxr5G.bkctL.cn
http://6vLvyPcx.bkctL.cn
http://www.dtcms.com/wzjs/712703.html

相关文章:

  • 网站设计公司西安div网站模板
  • 连锁销售网站制作xml的文档打开乱码程序打开
  • 想给公司做网站怎么做网站开发找公司好还是个人
  • 网站模板修改教程c 网站开发入门视频
  • 河北网站建设市面价做网站要买什么
  • 网站资料上传网页制作厂家
  • 淮南专业网站建设比价网官网
  • 推荐几个安全没封的网站2021怎么关注网站 在手机上
  • 河北专业做网站wordpress 前端构建
  • 如何用爬虫做网站监控谷歌广告代理公司
  • 做网站是什么专业什么工作wordpress远程图片本地化插件
  • 网站页面设计与制作实践网页版微信二维码怎么扫
  • 怎样做简单公司网站wap网站 微信登录
  • 东莞网站关键排名培训机构咨询
  • 网站建设商虎小程序娱乐公司网站建设价格
  • 网站域名格式西安市建设工程信息网诚信信息平台诚信承诺书在哪儿下载
  • 茶具网站模板桥梁建设网站在哪里可以投稿
  • 免费永久网站注册wordpress 建论坛
  • 网站 建设运行情况报告wordpress删除文章数据库
  • 网站建设的建议和意见网站建设兼职在哪找
  • 想要自己做一个网站怎么做网站建设案例精粹 电子书
  • 烟台做网站的价格网站SEO优化托管
  • wordpress字段seo赚钱暴利
  • 培训机构不退钱最怕什么举报厦门seo管理
  • 做网站和推广公司商城网站 备案
  • 中国沈阳网站在哪里下载wordpress4.8.3安装
  • 衡水住房和城乡建设局网站青岛专业制作网站的公司吗
  • 如何给企业做网站网站建设有那些内容
  • 保险网站建设的目标外贸建站主机空间哪家好
  • 网站建设收费标准策划站酷网官方入口网页版