当前位置：首页 > wzjs >正文

网站的维护怎么做网站seo设计

wzjs 2025/8/22 8:17:57

网站的维护怎么做,网站seo设计,杭州品牌网站建设,重庆聚百思网站开发机器学习 — KNN算法文章目录机器学习 --- KNN算法一，sklearn机器学习概述二，KNN算法---分类2.1样本距离判断2.2 KNN算法原理2.3 KNN缺点2.4 API2.5 使用sklearn中鸢尾花数据集实现KNN 一，sklearn机器学习概述获取数据、数据处理、特征工…

机器学习 — KNN算法

文章目录

机器学习 --- KNN算法
一，sklearn机器学习概述
二，KNN算法---分类
- 2.1样本距离判断
- 2.2 KNN算法原理
- 2.3 KNN缺点
- 2.4 API
- 2.5 使用sklearn中鸢尾花数据集实现KNN

一，sklearn机器学习概述

获取数据、数据处理、特征工程后，就可以交给预估器进行机器学习，流程和常用API如下。

1.实例化预估器(估计器)对象(estimator)， 预估器对象很多,都是estimator的子类（1）用于分类的预估器sklearn.neighbors.KNeighborsClassifier k-近邻sklearn.naive_bayes.MultinomialNB 贝叶斯sklearn.linear_model.LogisticRegressioon 逻辑回归sklearn.tree.DecisionTreeClassifier 决策树sklearn.ensemble.RandomForestClassifier 随机森林(2)用于回归的预估器sklearn.linear_model.LinearRegression线性回归sklearn.linear_model.Ridge岭回归(3)用于无监督学习的预估器sklearn.cluster.KMeans 聚类
2.进行训练，训练结束后生成模型estimator.fit(x_train, y_train)
3.模型评估(1)方式1，直接对比y_predict = estimator.predict(x_test)y_test == y_predict(2)方式2, 计算准确率accuracy = estimator.score(x_test, y_test)
4.使用模型(预测)
y_predict = estimator.predict(x_true)

二，KNN算法—分类

2.1样本距离判断

欧氏距离
曼哈顿距离

2.2 KNN算法原理

K-近邻算法（K-Nearest Neighbors，简称KNN）,根据K个邻居样本的类别来判断当前样本的类别;

如果一个样本在特征空间中的k个最相似(最邻近)样本中的大多数属于某个类别，则该类本也属于这个类别

比如: 有10000个样本,选出7个到样本A的距离最近的,然后这7个样本中假设:类别1有2个,类别2有3个,类别3有2个.那么就认为A样本属于类别2,因为它的7个邻居中类别2最多(近朱者赤近墨者黑)

2.3 KNN缺点

对于大规模数据集，计算量大，因为需要计算测试样本与所有训练样本的距离。

对于高维数据，距离度量可能变得不那么有意义，这就是所谓的“维度灾难”

需要选择合适的k值和距离度量，这可能需要一些实验和调整

2.4 API

class sklearn.neighbors.KNeighborsClassifier(n_neighbors=5, algorithm='auto'）
参数:                                             
(1)n_neighbors: int, default=5, 默认情况下用于kneighbors查询的近邻数，就是K
(2)algorithm:{‘auto’, ‘ball_tree’, ‘kd_tree’, ‘brute’}, default=’auto’。找到近邻的方式，注意不是计算距离		的方式，与机器学习算法没有什么关系，开发中请使用默认值'auto'
方法:(1) fit(x， y) 使用X作为训练数据和y作为目标数据  (2) predict(X)	预测提供的数据，得到预测数据

2.5 使用sklearn中鸢尾花数据集实现KNN

# 引入数据集
from sklearn.datasets import load_iris
# 引入KNN算法
from sklearn.neighbors import KNeighborsClassifier
# 引入标准化工具
from sklearn.preprocessing import StandardScaler
#引入数据集划分
from sklearn.model_selection import train_test_split
#引入joblib
import joblib#训练函数
def train():#加载数据iris = load_iris()#加载鸢尾花数据集X = iris.data#鸢尾花特征数据y = iris.target#鸢尾花标签数据#数据集划分X_train,X_test,y_train,y_test = train_test_split(X,y,test_size=0.2,random_state=22)#数据标准化transfer = StandardScaler()X_train = transfer.fit_transform(X_train)#创建knn模型model = KNeighborsClassifier(n_neighbors=5)#使用训练集训练模型model.fit(X_train,y_train)#测试集的预测结果X_test = transfer.transform(X_test)score = model.score(X_test,y_test)print("准确率:",score)#保存模型if score  > 0.9:joblib.dump(model,"./model/knn.pkl")joblib.dump(transfer,"./model/transfer.pkl")else:print("模型效果不佳，重新训练")# 推理函数
# 新数据预测
def detect():#加载数据model = joblib.load("./model/knn.pkl")transfer = joblib.load("./model/transfer.pkl")#新数据推理x_new = [[1,2,3,4]]x_new = transfer.transform(x_new)y_pred = model.predict(x_new)print("预测结果:",y_pred)if __name__ == '__main__':train()detect()

准确率: 0.9333333333333333
预测结果: [1]

查看全文

http://www.dtcms.com/wzjs/440027.html

帝国cms手机网站十大免费软文推广平台

定兴县住房和城乡建设局网站免费企业黄页查询官网

茂名优化网站建设seo教程视频论坛

怎么自己做H5网站廊坊关键词排名优化

宁波政府信息化网站建设珠海网站建设优化

做网站挣钱快吗厦门百度快照优化排名

十堰高端网站建设武汉seo优化顾问

腾讯云免费建站百度搜索引擎平台

招商加盟网站的图应该怎么做网络营销软文范文

怎么用dw做简单网站郑州百度推广哪家好

做代码和网站seo项目优化案例分析文档

做导购网站百度一下你就知道搜索引擎

佛山html5网站建设谷歌广告投放教程

企业网站的缺点软文媒体

县信用平台网站建设情况郑州seo外包平台

做好的网站如何上线专业搜索引擎seo技术公司

镇江网站建设yubei021seo快速排名多少钱

网站整体规划外链推广平台

网站建设准备工作小红书sem是什么意思

网站建设行业导航站点百度指数里的资讯指数是什么

河南商丘网站营销网站建设的因素

qq群推广链接江西seo推广软件

房地产网站建设提案百度网址大全简单版

做网站和网页区别足球联赛排名

校园网站建设经费申请报告免费网络营销平台

做网站的一些费用新网站百度多久收录

12306网站做的好还是百度做的好武汉网络推广网络营销

newspaper wordpress武汉seo网站优化排名

wordpress网站加速工具网站seo优化步骤

找人给公司做网站去哪找全网整合营销推广系统