当前位置: 首页 > wzjs >正文

成都网站建设火狐狸音乐中文网站模板下载

成都网站建设火狐狸,音乐中文网站模板下载,家居企业网站建设服务,wordpress图片主题工业风所有代码和文档均在golitter/Decoding-ML-Top10: 使用 Python 优雅地实现机器学习十大经典算法。 (github.com),欢迎查看。 在“无监督学习”中,训练样本的标记信息是未知的,目标是通过对无标记训练样本的学习来揭示数据的内在性质及规律&…

所有代码和文档均在golitter/Decoding-ML-Top10: 使用 Python 优雅地实现机器学习十大经典算法。 (github.com),欢迎查看。

在“无监督学习”中,训练样本的标记信息是未知的,目标是通过对无标记训练样本的学习来揭示数据的内在性质及规律,为进一步的数据分析提供基础,较为经典的是聚类。

**聚类试图将数据集中的样本划分为若干个通常是不相交的子集,每个子集称为一个“簇”。**聚类既能作为一个单独过程,用于找寻数据内在的分布结构,也可以作为分类等其他学习任务的前驱过程。

距离计算:

  • 连续属性及离散有序属性:闵可夫斯基距离:
    ∑ u = 1 n ∣ x i u − x j u p ∣ p \sqrt[p]{\sum_{u=1}^n|x_{iu} - x_{ju}}|^p pu=1nxiuxju p

  • 无序属性:VDM(Value Difference Metric)
    ∑ i = 1 k ∣ m u , a , i m u , a − m u , b , i m u , b ∣ p \sum_{i=1}^{k}{|\frac{m_{u,a,i}}{m_{u,a}}-\frac{m_{u,b,i}}{m_{u,b}}|^p} i=1kmu,amu,a,imu,bmu,b,ip

K均值算法(k-means):对于给定的样本集,按照样本之间的距离大小,将样本集划分为K个簇。让簇内的点尽量紧密的连在一起,而让簇间的距离尽量的大。给定样本集D,k-means算法针对聚类所得簇划分C最小化平方误差:
E = ∑ i = 1 k ∑ x ∈ C i ∣ ∣ x − u i ∣ ∣ 2 2 E\ =\ \sum_{i=1}^{k}\sum_{x\in C_i}\left|\left|x-u_i\right|\right|_2^2 E = i=1kxCixui22
K-Means聚类算法步骤实质是EM算法(最大期望算法)的模型优化过程,具体步骤如下:

  1. 随机选择k个样本作为初始簇类的均值向量

  2. 将每个样本数据集划分到离它距离最近的簇

  3. 根据每个样本所属的簇,更新簇类的均值向量

  4. 重复(2)(3)步,当达到最大迭代次数或簇类的均值向量不再改变

代码实现:

数据处理:

import pandas as pd
import numpy as np# https://sci2s.ugr.es/keel/dataset.php?cod=182#inicio
df = pd.read_csv('banana.dat', header=None)def get_data():return np.array(df.iloc[:, :2])

核心代码:

from data_processing import get_data
import numpy as np
import matplotlib.pyplot as plt# 初始化聚类中心
def init_centroids(data: np.array, k: int) -> np.array:return data[np.random.choice(data.shape[0], k, replace=False)]# 欧拉距离
def euclidean_distance(x: np.array, y: np.array) -> float:return np.sqrt(np.sum(np.square(x - y)))# 计算每个样本点到k个聚类中心的距离
def compute_distance(data: np.array, centroids: np.array) -> np.array:distance = np.zeros((data.shape[0], centroids.shape[0]))for i in range(centroids.shape[0]):distance[:, i] = np.apply_along_axis(euclidean_distance, 1, data, centroids[i])return distance# KMeans算法
def kmeans(data: np.array, k: int, max_iter: int = 10):centroids = init_centroids(data, k)for i in range(max_iter):distance = compute_distance(data, centroids)# 每个样本点到k个聚类中心的距离最小值的索引labels = np.argmin(distance, axis=1)for j in range(k):centroids[j] = np.mean(data[labels == j], axis=0)return labels, centroidsif __name__ == '__main__':data = get_data()k = 3centroids = init_centroids(data, k)labels, centroids = kmeans(data, k)# print(labels.shape)plt.title('K-Means Clustering', fontsize=16)plt.xlabel('Feature 1', fontsize=14)plt.ylabel('Feature 2', fontsize=14)plt.scatter(data[:, 0], data[:, 1], c=labels, cmap='viridis')plt.show()

在这里插入图片描述

机器学习之K-Means(k均值)算法_k-means算法-CSDN博客


文章转载自:

http://h5yysgoH.psLzp.cn
http://290pg362.psLzp.cn
http://hU2BhDqn.psLzp.cn
http://ZunMOKen.psLzp.cn
http://J7IfF2lz.psLzp.cn
http://D2CVRioW.psLzp.cn
http://PvUqSINh.psLzp.cn
http://rq7dKrxl.psLzp.cn
http://45ARIhi5.psLzp.cn
http://nh3zszGi.psLzp.cn
http://ePHDOUXJ.psLzp.cn
http://XDMSGd4E.psLzp.cn
http://wE8ZfUXT.psLzp.cn
http://xsIZKZAB.psLzp.cn
http://ki3ZVgKD.psLzp.cn
http://Yomb2CGX.psLzp.cn
http://umGbgnSQ.psLzp.cn
http://7zXWViMh.psLzp.cn
http://l6lIIn1v.psLzp.cn
http://r8fQO5zM.psLzp.cn
http://IopUCH8T.psLzp.cn
http://a7qdKq0p.psLzp.cn
http://gBpnJwWk.psLzp.cn
http://TVkUOUqb.psLzp.cn
http://Iidotldo.psLzp.cn
http://2sQUQJMM.psLzp.cn
http://iMdWV2Qr.psLzp.cn
http://P5vpIUz9.psLzp.cn
http://32ZLvX69.psLzp.cn
http://KP4n7gcO.psLzp.cn
http://www.dtcms.com/wzjs/771794.html

相关文章:

  • 重庆做网站优化公司商标设计logo图案
  • 厦门做网站维护的公司怎么自己做导购网站
  • 胶州网站建设公司哪家好网站商城运营成本
  • 网站建设布吉门户类型的网站
  • 上海专业网站建设价仲恺建设局网站
  • 蜜芽免费网站域名优秀网页设计师
  • 做网站添加本地图片微信公众号可以自动导入wordpress
  • 一个好的网站应该具有什么条件电子商务网站平台开发建设方案
  • 资格证网站怎么做wordpress 添加用户登录
  • 鹤壁seo公司超云seo优化
  • 建设网站的条件网站建设当中的技术解决方案
  • 沈阳网站建设培训外贸网络推广哪个好
  • 建设医院的网站泰安优化公司
  • asp网站建设课程设计搜索引擎整合营销
  • 网站建设中英版品牌营销咨询机构
  • 南宁网络营销网站生态旅游网站的建设
  • 银川怎么做网站网站开发的未来展望
  • 网站数据库查询怎么做北京州网站建设公司
  • 网站备案流程是什么附子seo
  • 用h5做网站首页代码wordpress文章页实现图片幻灯展现
  • 佛山市三山新城建设局网站ipad 设计网站
  • 网站设计 北京店临清建设局网站
  • 如何免费做网站推广的力杨网站建设
  • 网站站长登录方式公司免费建网站
  • 网站一级域名和二级域名区别成都网站建设制作公司
  • 网站换模板要怎么做地方网站名称
  • wordpress网站添加阅读全文给小说网站做编辑
  • 做论坛网站需要备案惠州营销网站建设
  • 佛山北京网站建设公司电话外呼系统
  • 内部门户网站建设方案东莞网页设计费用