当前位置: 首页 > wzjs >正文

阿里云中英文网站建设地推推广平台

阿里云中英文网站建设,地推推广平台,网站设计英语,wordpress 七牛云插件1、概要 本篇学习AI人工智能机器学习之聚类分析,以KMeans、AgglomerativeClustering、DBSCAN为例,从代码层面讲述机器学习中的聚类分析。 2、聚类分析 - 简介 聚类分析是一种无监督学习的方法,用于将数据集中的样本划分为不同的组&#xff…

1、概要

  本篇学习AI人工智能机器学习之聚类分析,以KMeans、AgglomerativeClustering、DBSCAN为例,从代码层面讲述机器学习中的聚类分析。

2、聚类分析 - 简介

聚类分析是一种无监督学习的方法,用于将数据集中的样本划分为不同的组(簇),使得同一组中的样本相似度较高,而不同组之间的样本相似度较低。

sklearn.cluster提供了多种聚类算法

  • K均值聚类(K-Means Clustering),最常用的聚类算法之一,通过迭代找到 K 个簇的中心,并将样本分配给离其最近的中心,从而形成 K 个簇。
  • 层次聚类(Agglomerative Clustering),通过构建一个树形结构(树状图)来表示数据的聚类过程,生成不同层次的聚类结果。
  • DBSCAN(基于密度的聚类),通过测量数据点的密度来识别簇,能够发现任意形状的簇,并且可以有效处理噪声。

本篇,以三个示例讲述聚类分析使用方法:

  • 示例1:对数据集进行K均值聚类分析
  • 示例2:对数据集进行层次聚类分析
  • 示例3:对数据集进行基于密度的聚类分析

本篇相关资料代码参见:AI人工智能机器学习相关知识资源及使用的示例代码

3、聚类分析

3.1、安装依赖

python安装机器学习库: pip install scikit-learn

3.2、示例1: 对数据集进行K均值聚类分析
import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import make_blobs
from sklearn.cluster import KMeans
from sklearn.metrics import silhouette_score# 生成样本数据
X, y = make_blobs(n_samples=300, centers=4, cluster_std=0.60, random_state=0)# 创建 KMeans 模型
kmeans = KMeans(n_clusters=4, init='k-means++', max_iter=300, n_init='auto') 
kmeans.fit(X)# 获取聚类结果
y_kmeans = kmeans.predict(X)# 评估聚类效果 - 轮廓系数(Silhouette Score):衡量样本与其聚类的相似性。值范围在 [-1, 1] 之间,值越大表示聚类效果越好。
score = silhouette_score(X, y_kmeans)
print(f"Silhouette Score: {score:.3f}")# 可视化结果
plt.scatter(X[:, 0], X[:, 1], c=y_kmeans, s=50, cmap='viridis')
centers = kmeans.cluster_centers_
plt.scatter(centers[:, 0], centers[:, 1], c='red', s=200, alpha=0.75, marker='o')
plt.title("K-Means Clustering")
plt.show()

运行上述代码的输出:

Silhouette Score: 0.682   

在这里插入图片描述

参数释义:

  • n_clusters:指定要形成的簇的数量。
  • init:初始化簇中心的方法,常用的有 ‘k-means++’(默认)和 ‘random’。
  • max_iter:最大迭代次数。
  • n_init:运行算法的次数,选择最佳结果。
3.3、示例2:对数据集进行层次聚类分析
import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import make_blobs
from sklearn.cluster import AgglomerativeClustering
from sklearn.metrics import silhouette_score# 生成样本数据
X, y = make_blobs(n_samples=300, centers=4, cluster_std=0.60, random_state=0)# 创建层次聚类模型
agg_clustering = AgglomerativeClustering(n_clusters=4, metric='euclidean', linkage='ward',)
y_agg = agg_clustering.fit_predict(X)# 评估聚类效果 - 轮廓系数(Silhouette Score):衡量样本与其聚类的相似性。值范围在 [-1, 1] 之间,值越大表示聚类效果越好。
score = silhouette_score(X, y_kmeans)
print(f"Silhouette Score: {score:.3f}")# 可视化结果
plt.scatter(X[:, 0], X[:, 1], c=y_agg, s=50, cmap='viridis')
plt.title("Agglomerative Clustering")
plt.show()

运行上述代码的输出:

Silhouette Score: 0.682

在这里插入图片描述

参数释义:

  • n_clusters:指定要形成的簇的数量。
  • metric:计算样本之间距离的方式,常用的有 ‘euclidean’(欧氏距离)和 ‘manhattan’(曼哈顿距离)。
  • linkage:聚类的连接方式,常用的有 ‘ward’(默认)、‘complete’、‘average’ 和 ‘single’。
3.4、示例3:对数据集进行基于密度的聚类分析
import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import make_blobs
from sklearn.cluster import DBSCAN
from sklearn.metrics import silhouette_score# 生成样本数据
X, y = make_blobs(n_samples=300, centers=4, cluster_std=0.60, random_state=0)# 创建 DBSCAN 模型
dbscan = DBSCAN(eps=0.5, min_samples=5)
y_dbscan = dbscan.fit_predict(X)# 评估聚类效果 - 轮廓系数(Silhouette Score):衡量样本与其聚类的相似性。值范围在 [-1, 1] 之间,值越大表示聚类效果越好。
score = silhouette_score(X, y_kmeans)
print(f"Silhouette Score: {score:.3f}")# 可视化结果
plt.scatter(X[:, 0], X[:, 1], c=y_dbscan, s=50, cmap='viridis')
plt.title("DBSCAN Clustering")
plt.show()

运行上述代码的输出:

Silhouette Score: 0.682

在这里插入图片描述

参数释义:

  • eps:指定形成簇的最大距离(邻域的半径)。
  • min_samples:形成一个簇所需的最小样本数。

4、 总结

本篇以KMeans、AgglomerativeClustering、DBSCAN为例,从代码层面讲述机器学习中的聚类分析,同时使用轮廓系数评估了聚类效果。每种算法都有其独特的优缺点,适用于不同类型的数据集。在实际应用中,选择合适的聚类算法和优化参数是获得良好聚类效果的关键。通过可视化和评估指标,可以更好地理解聚类结果的质量。


文章转载自:

http://tba4OqOJ.ggnfy.cn
http://3VUO1L2C.ggnfy.cn
http://m1AQjeCT.ggnfy.cn
http://aqKFyA8h.ggnfy.cn
http://vkpo3s5Z.ggnfy.cn
http://Y2dCBw5m.ggnfy.cn
http://yL1JIhks.ggnfy.cn
http://FPOb1YG9.ggnfy.cn
http://A3xpXJR0.ggnfy.cn
http://wWEiKioZ.ggnfy.cn
http://L2xriA76.ggnfy.cn
http://COnoqCtc.ggnfy.cn
http://EQEHTS7w.ggnfy.cn
http://36ChgCTJ.ggnfy.cn
http://UDB0w1Ot.ggnfy.cn
http://FWlsJgkC.ggnfy.cn
http://1xbUfbbB.ggnfy.cn
http://QuFD0imx.ggnfy.cn
http://fRqoguMn.ggnfy.cn
http://OzrGqSHT.ggnfy.cn
http://ZwIfEDnf.ggnfy.cn
http://usmBhxxN.ggnfy.cn
http://ahbcxtGL.ggnfy.cn
http://FUvz7I4m.ggnfy.cn
http://Wwz9UFsB.ggnfy.cn
http://mExi4QYR.ggnfy.cn
http://jp2XBvEA.ggnfy.cn
http://2BEe6E8F.ggnfy.cn
http://0WwkqpS0.ggnfy.cn
http://cC9WUGfe.ggnfy.cn
http://www.dtcms.com/wzjs/623683.html

相关文章:

  • app优化网站开发简单代码制作
  • 河北哪些大学网站建设专业比较好专题探索网站开发教学模式的结构
  • 高端文化网站电影网页制作素材
  • 做网站技术方法有做网站的服务器
  • 电脑网站适应手机如何做网站开发前端学习
  • 网站建设推广方案百度网站建设一年多少钱
  • 珠海响应式网站建设推广公司做关键词排名卖网站
  • 网站建设教程 pdf适合个人做的外贸平台
  • 泉州市住房与城乡建设网站十大购物网站排行榜
  • 做软装在那些网站找家具冷色网站
  • 西安建筑人才网做十来个网站优化
  • 邢台精美网站建设工程app下载赚钱
  • 外贸网站建设平台哪个好北京工商注册app下载
  • 长春百度网站快速优化怎么用vps建网站
  • 在哪网站开发软件荣成市信用建设官方网站
  • 东莞网站网站建设定制软件开发文案
  • 境外网站服务器郑州建设局官方网站
  • 网易云网站开发温州网站建设设计公司
  • 网站名称是网址吗做物流网站电话号码
  • 赣州网站建设费用wordpress pdf下载链接
  • 电商网站seo公司商丘免费网站建设开发公司
  • 企业网站开发费用包括哪些郑州经济技术开发区属于什么区
  • 合肥市做网站多少钱html5网页制作源码大全
  • 搬家公司怎么做网站古尔邦节网站建设
  • 手机建网站优帮云icp经营性许可证申请条件
  • 开锁公司做网站智能建造师证书
  • 宁波网站建设培训怎么注册一个自己的品牌
  • 网站建设课程思政大连 网站开发
  • 安徽哪家公司做网站比较好湖南seo优化哪家好
  • 怎么用动图做网站背景微信公众号怎么搞