当前位置: 首页 > wzjs >正文

前后端分离企业网站源码十大利润最高的实体店

前后端分离企业网站源码,十大利润最高的实体店,dw做网站字体 别人 电脑,wordpress放视频教程KMeans算法案例 案例介绍 已知:客户性别、年龄、年收入、消费指数 需求:对客户进行分析,找到业务突破口,寻找黄金客户 数据集共包含顾客的数据, 数据共有 4 个特征, 数据共有 200 条。接下来,使用聚类算法对具有相似…

KMeans算法案例

案例介绍

已知:客户性别、年龄、年收入、消费指数

需求:对客户进行分析,找到业务突破口,寻找黄金客户

数据集共包含顾客的数据, 数据共有 4 个特征, 数据共有 200 条。接下来,使用聚类算法对具有相似特征的的顾客进行聚类,并可视化聚类结果。

案例实现

确定最佳K值

import pandas as pd
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt
from sklearn.metrics import silhouette_score
​
# 聚类分析用户分群
dataset = pd.read_csv('data/customers.csv')
dataset.info()
print('dataset-->\n', dataset)
X = dataset.iloc[:, [3, 4]]
print('X-->\n', X)mysse = []
mysscore = []# 评估聚类个数
for i in range(2, 11):mykeans = KMeans(n_clusters=i)mykeans.fit(X)mysse.append(mykeans.inertia_)  # inertia 簇内误差平方和ret = mykeans.predict(X)mysscore.append(silhouette_score(X, ret))  # sc系数 聚类需要1个以上的类别plt.plot(range(2, 11), mysse)
plt.title('the elbow method')
plt.xlabel('number of clusters')
plt.ylabel('mysse')
plt.grid()
plt.show()
plt.title('sh')
plt.plot(range(2, 11), mysscore)
plt.grid(True)
plt.show()

通过肘方法、sh系数都可以看出,聚成5类效果最好

顾客聚类

dataset = pd.read_csv('data/customers.csv')
dataset.head()
#全部行,第四第五列  Annual Income (k$) 和 Spending Score (1-100)
X = dataset.iloc[:, [3, 4]].values  # 返回的是numpy的ndarray
kmeans = KMeans(n_clusters = 5, init = 'k-means++', random_state = 42) #k=5 
y_pred = kmeans.fit_predict(X)

解释:

获取质心坐标

# 获取质心点坐标
centroids = kmeans.cluster_centers_
"""
结果是二维数组
[[25.72727273 79.36363636][87.75       17.58333333][55.0875     49.7125    ][86.53846154 82.12820513][26.30434783 20.91304348]]
"""

获取每簇的点

y_pred == 0
:这是一个布尔索引操作,它会创建一个布尔数组,其中每个元素表示对应的样本是否属于簇0。
例如,如果 y_pred 是 [0, 1, 0, 2, 0],那么 y_pred == 0 的结果将是 [True, False, True, False, True].X[y_pred == 0, 0]
:这行代码使用布尔索引从数据集 X 中选择所有属于簇0的样本的第一个特征值。
具体来说,它会返回一个一维数组,包含所有被标记为簇0的样本的第一个特征值.例如,假设 
X 是一个二维数组,形状为 
(n_samples, n_features),其中 n_samples 是样本数量,n_features 是特征数量。如果 
y_pred 是 [0, 1, 0, 2, 0],那么X[y_pred == 0, 0] 将返回一个一维数组,包含X 中索引为0、2和4的样本的第一个特征值.

画图展示聚类结果

# 画图展示聚类结果
plt.scatter(X[y_pred == 0, 0], X[y_pred == 0, 1], s = 100, c = 'red', label = 'Standard')
plt.scatter(X[y_pred == 1, 0], X[y_pred == 1, 1], s = 100, c = 'blue', label = 'Traditional')
plt.scatter(X[y_pred == 2, 0], X[y_pred == 2, 1], s = 100, c = 'green', label = 'Normal')
plt.scatter(X[y_pred == 3, 0], X[y_pred == 3, 1], s = 100, c = 'cyan', label = 'Youth')
plt.scatter(X[y_pred == 4, 0], X[y_pred == 4, 1], s = 100, c = 'magenta', label = 'TA')
# kmeans.cluster_centers_:聚类后每类的中心点
plt.scatter(kmeans.cluster_centers_[:, 0], kmeans.cluster_centers_[:, 1], s = 300, c = 'black', label = 'Centroids')
plt.title('Clusters of customers')
plt.xlabel('Annual Income (k$)')
plt.ylabel('Spending Score (1-100)')
plt.legend()
plt.show()

从图中可以看出,聚成5类,右上角属于挣的多,消费的也多黄金客户群

http://www.dtcms.com/wzjs/591739.html

相关文章:

  • 如何检测网站是否安全html跳转另一个网页的代码
  • 诸暨公司网站建设搭建网站源码
  • 免费开网站系统国家备案网
  • wordpress网站代码文件太多购物 网站建设的市场分析
  • 网站建设好后打开是目录文件舜元建设 集团 有限公司网站
  • 手机h5网站模板相册管理网站模板下载
  • 四川建设厅官方网站九大员通知wordpress ip 跳转
  • 做服务的网站起名重庆新闻联播历年片头
  • 来个可以做渗透的网站邮件营销 wordpress
  • 目前做啥网站致富wordpress 搜索不管用
  • 对网站策划的看法盐城哪家专业做网站
  • php 网站配置2345影视大全可以放心下载吗
  • 免费域名的网站有哪些煎蛋 wordpress
  • 男女这样做那个网站淮安建设工程协会网站查询系统
  • 余干网站建设制作望野古诗原文翻译
  • 网站交易平台怎么注册做电商从哪里入手
  • 做搜狗网站关键词排名wordpress后台登陆美化
  • 石嘴山网站关于两学一做c2c平台分类
  • 精品课程网站建设 公司网站建设与维护流程
  • 任经理 徐州网站建设做影视网站不备案
  • 官方网站建设计划书wordpress主题2019
  • 哪个博客可以做单页网站有经验的赣州网站建设
  • 如何做学校网站上海网络维护哪家品质好
  • 网站中全景是怎么做的公司网站用服务器
  • 广州网站设计工作室wordpress 广告插件
  • 搜索引擎提交网站做瑞士网站
  • 上海网站建设公司指南百度收录网站之后又怎么做
  • 做育儿类网站用什么程序好宝安网站建设方案外包
  • 网站设计侵权养生门户网站源码
  • 公司网站建设要求书腾讯短网址在线生成