当前位置: 首页 > wzjs >正文

网站的维护怎么做网站seo设计

网站的维护怎么做,网站seo设计,杭州品牌网站建设,重庆聚百思网站开发机器学习 — KNN算法 文章目录 机器学习 --- KNN算法一,sklearn机器学习概述二,KNN算法---分类2.1样本距离判断2.2 KNN算法原理2.3 KNN缺点2.4 API2.5 使用sklearn中鸢尾花数据集实现KNN 一,sklearn机器学习概述 获取数据、数据处理、特征工…

机器学习 — KNN算法


文章目录

  • 机器学习 --- KNN算法
  • 一,sklearn机器学习概述
  • 二,KNN算法---分类
    • 2.1样本距离判断
    • 2.2 KNN算法原理
    • 2.3 KNN缺点
    • 2.4 API
    • 2.5 使用sklearn中鸢尾花数据集实现KNN


一,sklearn机器学习概述

获取数据、数据处理、特征工程后,就可以交给预估器进行机器学习,流程和常用API如下。

1.实例化预估器(估计器)对象(estimator), 预估器对象很多,都是estimator的子类(1)用于分类的预估器sklearn.neighbors.KNeighborsClassifier k-近邻sklearn.naive_bayes.MultinomialNB 贝叶斯sklearn.linear_model.LogisticRegressioon 逻辑回归sklearn.tree.DecisionTreeClassifier 决策树sklearn.ensemble.RandomForestClassifier 随机森林(2)用于回归的预估器sklearn.linear_model.LinearRegression线性回归sklearn.linear_model.Ridge岭回归(3)用于无监督学习的预估器sklearn.cluster.KMeans 聚类
2.进行训练,训练结束后生成模型estimator.fit(x_train, y_train)
3.模型评估(1)方式1,直接对比y_predict = estimator.predict(x_test)y_test == y_predict(2)方式2, 计算准确率accuracy = estimator.score(x_test, y_test)
4.使用模型(预测)
y_predict = estimator.predict(x_true)

二,KNN算法—分类

2.1样本距离判断

  • 欧氏距离
    在这里插入图片描述
  • 曼哈顿距离
    在这里插入图片描述

2.2 KNN算法原理

K-近邻算法(K-Nearest Neighbors,简称KNN),根据K个邻居样本的类别来判断当前样本的类别;

如果一个样本在特征空间中的k个最相似(最邻近)样本中的大多数属于某个类别,则该类本也属于这个类别

比如: 有10000个样本,选出7个到样本A的距离最近的,然后这7个样本中假设:类别1有2个,类别2有3个,类别3有2个.那么就认为A样本属于类别2,因为它的7个邻居中 类别2最多(近朱者赤近墨者黑)

2.3 KNN缺点

​ 对于大规模数据集,计算量大,因为需要计算测试样本与所有训练样本的距离。

​ 对于高维数据,距离度量可能变得不那么有意义,这就是所谓的“维度灾难”

​ 需要选择合适的k值和距离度量,这可能需要一些实验和调整

2.4 API

class sklearn.neighbors.KNeighborsClassifier(n_neighbors=5, algorithm='auto')
参数:                                             
(1)n_neighbors: int, default=5, 默认情况下用于kneighbors查询的近邻数,就是K
(2)algorithm:{‘auto’, ‘ball_tree’, ‘kd_tree’, ‘brute’}, default=’auto’。找到近邻的方式,注意不是计算距离		的方式,与机器学习算法没有什么关系,开发中请使用默认值'auto'
方法:(1) fit(x, y) 使用X作为训练数据和y作为目标数据  (2) predict(X)	预测提供的数据,得到预测数据 

2.5 使用sklearn中鸢尾花数据集实现KNN

# 引入数据集
from sklearn.datasets import load_iris
# 引入KNN算法
from sklearn.neighbors import KNeighborsClassifier
# 引入标准化工具
from sklearn.preprocessing import StandardScaler
#引入数据集划分
from sklearn.model_selection import train_test_split
#引入joblib
import joblib#训练函数
def train():#加载数据iris = load_iris()#加载鸢尾花数据集X = iris.data#鸢尾花特征数据y = iris.target#鸢尾花标签数据#数据集划分X_train,X_test,y_train,y_test = train_test_split(X,y,test_size=0.2,random_state=22)#数据标准化transfer = StandardScaler()X_train = transfer.fit_transform(X_train)#创建knn模型model = KNeighborsClassifier(n_neighbors=5)#使用训练集训练模型model.fit(X_train,y_train)#测试集的预测结果X_test = transfer.transform(X_test)score = model.score(X_test,y_test)print("准确率:",score)#保存模型if score  > 0.9:joblib.dump(model,"./model/knn.pkl")joblib.dump(transfer,"./model/transfer.pkl")else:print("模型效果不佳,重新训练")# 推理函数
# 新数据预测
def detect():#加载数据model = joblib.load("./model/knn.pkl")transfer = joblib.load("./model/transfer.pkl")#新数据推理x_new = [[1,2,3,4]]x_new = transfer.transform(x_new)y_pred = model.predict(x_new)print("预测结果:",y_pred)if __name__ == '__main__':train()detect()
准确率: 0.9333333333333333
预测结果: [1]
http://www.dtcms.com/wzjs/440027.html

相关文章:

  • 帝国cms手机网站十大免费软文推广平台
  • 定兴县住房和城乡建设局网站免费企业黄页查询官网
  • 茂名优化网站建设seo教程视频论坛
  • 怎么自己做H5网站廊坊关键词排名优化
  • 宁波政府信息化网站建设珠海网站建设优化
  • 做网站挣钱快吗厦门百度快照优化排名
  • 十堰高端网站建设武汉seo优化顾问
  • 腾讯云免费建站百度搜索引擎平台
  • 招商加盟网站的图应该怎么做网络营销软文范文
  • 怎么用dw做简单网站郑州百度推广哪家好
  • 做代码和网站seo项目优化案例分析文档
  • 做导购网站百度一下你就知道搜索引擎
  • 佛山html5网站建设谷歌广告投放教程
  • 企业网站的缺点软文媒体
  • 县信用平台网站建设情况郑州seo外包平台
  • 做好的网站如何上线专业搜索引擎seo技术公司
  • 镇江网站建设yubei021seo快速排名多少钱
  • 网站整体规划外链推广平台
  • 网站建设准备工作小红书sem是什么意思
  • 网站建设行业导航站点百度指数里的资讯指数是什么
  • 河南商丘网站营销网站建设的因素
  • qq群推广链接江西seo推广软件
  • 房地产网站建设提案百度网址大全简单版
  • 做网站和网页区别足球联赛排名
  • 校园网站建设经费申请报告免费网络营销平台
  • 做网站的一些费用新网站百度多久收录
  • 12306网站做的好还是百度做的好武汉网络推广网络营销
  • newspaper wordpress武汉seo网站优化排名
  • wordpress网站加速工具网站seo优化步骤
  • 找人给公司做网站去哪找全网整合营销推广系统