当前位置: 首页 > wzjs >正文

企业网站是否可以做淘宝客网络公司优化关键词

企业网站是否可以做淘宝客,网络公司优化关键词,太原市做网站公司,如何做网站免费搭桥链接利用knn算法实现手写数字分类 1.作者介绍2.KNN算法2.1KNN(K-Nearest Neighbors)算法核心思想2.2KNN算法的工作流程2.3优缺点2.4 KNN算法图示介绍 3.实验过程3.1安装所需库3.2 MNIST数据集3.3 导入手写数字图像进行分类3.4 完整代码3.5 实验结果 1.作者介…

利用knn算法实现手写数字分类

  • 1.作者介绍
  • 2.KNN算法
    • 2.1KNN(K-Nearest Neighbors)算法核心思想
    • 2.2KNN算法的工作流程
    • 2.3优缺点
    • 2.4 KNN算法图示介绍
  • 3.实验过程
    • 3.1安装所需库
    • 3.2 MNIST数据集
    • 3.3 导入手写数字图像进行分类
    • 3.4 完整代码
    • 3.5 实验结果

1.作者介绍

王鹏飞,男,西安工程大学电子信息学院,2024级研究生
研究方向:机器视觉与人工智能
电子邮件:2018659934@QQ.com

王海博, 男 , 西安工程大学电子信息学院, 2024级研究生, 张宏伟人工智能课题组
研究方向:模式识别与人工智能
电子邮件:1137460680@qq.com

2.KNN算法

2.1KNN(K-Nearest Neighbors)算法核心思想

将训练数据保存下来,对于一个新的数据点,通过查看其在特征空间中最近的K个邻居来预测其类别或值。针对分类任务:如果K个邻居中多数属于某个类别,那么新数据点也被归为该类别。

2.2KNN算法的工作流程

(1) 数据准备
特征提取:将数据集中的每个样本表示为特征向量。
数据标准化:由于KNN依赖距离计算,因此需要对特征进行标准化(如归一化或Z分数标准化),以消除不同特征量纲的影响。

(2) 距离计算
对于一个新的数据点,计算它与数据集中每个点之间的距离。常用的距离度量方式包括:欧氏距离、曼哈顿距离和明可夫斯基距离。

(3) 确定最近邻
根据计算出的距离,找出与新数据点距离最近的K个点,这K个点称为“最近邻”。
K是一个超参数,需要根据具体问题选择合适的值。K值过小可能导致过拟合,K值过大可能导致模型过于平滑。

(4) 进行预测
分类任务:统计K个最近邻中每个类别的出现频率,选择出现次数最多的类别作为新数据点的预测类别。

2.3优缺点

(1) 优点
简单易实现:原理直观,实现代码简单。
无需训练:KNN不需要像其他算法那样进行复杂的训练过程,只需在预测时计算距离。
对复杂数据集表现良好:可以很好地处理多类别问题和非线性数据。
(2) 缺点
计算效率低:每次预测都需要计算新数据点与所有训练数据点之间的距离,计算量大。
存储需求高:需要存储整个训练数据集。
对K值和距离度量敏感:K值的选择和距离度量方式对模型性能影响较大。

2.4 KNN算法图示介绍

在这里插入图片描述
见上图所示,五角星为新输入的数据,原训练数据有Class A和Class B两类,对于新输入的数据,根据特征向量计算新输入数据点与训练集数据点之间的距离,根据所选K值确定出,新数据最邻近K个点,图示第一次k值选取为3时,其中Class B类占2/3,所以新数据将被分类为Class B类。
当k值选取为6时,见上图所示,Class A类占4/6,所以此时对于新数据点将被归为Class A类。由此可见K值的选择对于分类的结果存在一定的影响,因此k值的选择对于结果有重要的作用。

3.实验过程

3.1安装所需库

import numpy as np
from sklearn.datasets import fetch_openml
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score, classification_report
import cv2
from PIL import Image
import matplotlib.pyplot as plt

在编写代码前需要安装上述的库和所需的函数。

3.2 MNIST数据集

MNIST数据集来自美国国家标准与技术研究所。训练集由来自250个不同人手写的数字构成,测试集也是同样的手写数字数据,保证了测试集和训练集的作者集不相交。MNIST数据集一共有7万张图片,其中6万张是训练集,1万张是测试集。每张图片是28 × 28像素 的0 − 9的手写数字图片组成。每个图片是黑底白字的灰度图像。MNIST数据集可以导入fetch_openml函数从OpenML平台加载数据集。

3.3 导入手写数字图像进行分类

# 导入自定义图像并进行预测
def preprocess_image(image_path):image = cv2.imread(image_path, cv2.IMREAD_GRAYSCALE)image = cv2.resize(image, (28, 28))image = cv2.bitwise_not(image)image = image.reshape(1, -1)image = scaler.transform(image)return image
def predict_image(image_path):image = preprocess_image(image_path)prediction = knn.predict(image)return prediction[0]
print("Testing custom image...")
image_path = "d:/wenjian/1.jpg"  #更改为自己的路径
prediction = predict_image(image_path)
print(f"Predicted digit: {prediction}")
# 显示图像
image = cv2.imread(image_path, cv2.IMREAD_GRAYSCALE)
image = cv2.resize(image, (28, 28))
image = cv2.bitwise_not(image)
plt.imshow(image, cmap="gray")
plt.title(f"Predicted Digit: {prediction}")
plt.show()

导入一张白底黑字的手写数字图像,并对图像进行预处理使得格式和灰度值与其训练集相同,本次实验导入的是白底黑字的手写数字图像,因为距离计算是依据灰度图像的灰度值进行计算,训练集的图像是黑底白字的灰度图像,因此需要对灰度值进行反转,否则会造成预测误差较大。导入图像路径需更改为自己图像路径。

3.4 完整代码

import numpy as np
from sklearn.datasets import fetch_openml
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score, classification_report
import cv2
from PIL import Image
import matplotlib.pyplot as plt# 加载MNIST数据集
print("Loading MNIST dataset...")
mnist = fetch_openml('mnist_784', version=1)
X, y = mnist["data"], mnist["target"]
y = y.astype(np.uint8)
# 数据预处理
print("Preprocessing data...")
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)
# 训练KNN模型
print("Training KNN model...")
knn = KNeighborsClassifier(n_neighbors=5)
knn.fit(X_train, y_train)
# 评估模型
print("Evaluating model...")
y_pred = knn.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
print(f"Accuracy: {accuracy:.4f}")
print(classification_report(y_test, y_pred))
# 导入自定义图像并进行预测
def preprocess_image(image_path):image = cv2.imread(image_path, cv2.IMREAD_GRAYSCALE)image = cv2.resize(image, (28, 28))image = cv2.bitwise_not(image)image = image.reshape(1, -1)image = scaler.transform(image)return image
def predict_image(image_path):image = preprocess_image(image_path)prediction = knn.predict(image)return prediction[0]
print("Testing custom image...")
image_path = "d:/wenjian/1.jpg"  #更改为自己的路径
prediction = predict_image(image_path)
print(f"Predicted digit: {prediction}")
# 显示图像
image = cv2.imread(image_path, cv2.IMREAD_GRAYSCALE)
image = cv2.resize(image, (28, 28))
image = cv2.bitwise_not(image)
plt.imshow(image, cmap="gray")
plt.title(f"Predicted Digit: {prediction}")
plt.show()

3.5 实验结果

在这里插入图片描述

http://www.dtcms.com/wzjs/52469.html

相关文章:

  • 网站建设长沙长沙百度网站排名优化
  • 个人简介html代码简单百度seo快速排名
  • Thinkphp开发wordpress合肥seo排名收费
  • 网站建设+开源刷seo关键词排名软件
  • 灯饰网站源码网页设计与制作个人网站模板
  • 如何免费制作企业网站不受国内限制的浏览器
  • 有没有专门做奶粉的网站小学培训机构
  • 域名是什么样的百度关键词怎么优化
  • 网站建设方案设计是什么意思济南最新消息今天
  • 做减肥网站漯河搜狗关键词优化排名软件
  • 主流网站seo关键词排名怎么提升
  • 做推广网站公司抖音seo点击软件排名
  • 南通网站建设机构成都本地推广平台
  • wordpress生成地图抖音seo什么意思
  • 怎样拍照产品做网站百度seo怎么查排名
  • 广州专业网站建设有哪些网络营销公司全网推广公司
  • 电子商务网站建设需要哪些步骤海外营销公司
  • 实体店100个营销策略seo快速优化报价
  • 做网站的服务器怎么选页面关键词优化
  • 有哪些做汽配的网站佛山百度关键词seo外包
  • 做网站代码第一不sem是什么显微镜
  • 建设银行招聘网站如何制作简单的网页链接
  • 什么网站做批发最便宜搜索引擎优化论文3000字
  • 网站实施过程太原seo计费管理
  • 医药网站备案抄一则新闻四年级
  • 做公益的网站关键词歌词图片
  • 在线制作二维码网站怎么做公众号
  • 做微信首图的网站网络营销公司排行
  • wpf 网站开发搜索引擎关键词广告
  • 幼儿园教育类网站模板下载代运营公司哪家好一些