当前位置: 首页 > wzjs >正文

东莞清洁服务网站建设seo课程

东莞清洁服务网站建设,seo课程,html5网站建设 教程,wordpress 获取当前文章id1. 引言 鸢尾花(Iris)数据集是机器学习领域的经典数据集之一,广泛用于分类任务的教学和研究。本教程将使用 Python 及其机器学习库(如 scikit-learn)构建一个鸢尾花分类模型,帮助读者掌握数据预处理、特征…

1. 引言

鸢尾花(Iris)数据集是机器学习领域的经典数据集之一,广泛用于分类任务的教学和研究。本教程将使用 Python 及其机器学习库(如 scikit-learn)构建一个鸢尾花分类模型,帮助读者掌握数据预处理、特征工程、模型训练及评估的全过程。

2. 环境准备

在开始之前,请确保安装了必要的 Python 库。使用以下命令安装所需依赖:

pip install numpy pandas matplotlib seaborn scikit-learn

3. 数据集介绍

鸢尾花数据集由 150 条样本组成,每个样本包含四个特征:

  • sepal length(萼片长度,cm)
  • sepal width(萼片宽度,cm)
  • petal length(花瓣长度,cm)
  • petal width(花瓣宽度,cm)

目标变量是鸢尾花的类别,共分为 3 类:

  • Setosa(山鸢尾)
  • Versicolor(变色鸢尾)
  • Virginica(维吉尼亚鸢尾)

4. 数据加载与探索

import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
from sklearn import datasets# 加载数据集
data = datasets.load_iris()
df = pd.DataFrame(data.data, columns=data.feature_names)
df['species'] = data.target# 显示前 5 行数据
print(df.head())

5. 数据可视化

5.1 特征分布

sns.pairplot(df, hue='species', diag_kind='kde')
plt.show()

5.2 相关性分析

plt.figure(figsize=(8,6))
sns.heatmap(df.corr(), annot=True, cmap='coolwarm')
plt.show()

6. 数据预处理

from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler# 分离特征与标签
X = df.drop(columns=['species'])
y = df['species']# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)# 标准化处理
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

7. 训练分类模型

7.1 逻辑回归

from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score, classification_reportmodel_lr = LogisticRegression()
model_lr.fit(X_train, y_train)
y_pred_lr = model_lr.predict(X_test)print("Logistic Regression Accuracy:", accuracy_score(y_test, y_pred_lr))
print(classification_report(y_test, y_pred_lr))

7.2 支持向量机(SVM)

from sklearn.svm import SVCmodel_svm = SVC(kernel='linear')
model_svm.fit(X_train, y_train)
y_pred_svm = model_svm.predict(X_test)print("SVM Accuracy:", accuracy_score(y_test, y_pred_svm))
print(classification_report(y_test, y_pred_svm))

7.3 随机森林

from sklearn.ensemble import RandomForestClassifiermodel_rf = RandomForestClassifier(n_estimators=100)
model_rf.fit(X_train, y_train)
y_pred_rf = model_rf.predict(X_test)print("Random Forest Accuracy:", accuracy_score(y_test, y_pred_rf))
print(classification_report(y_test, y_pred_rf))

8. 模型评估与对比

from sklearn.metrics import confusion_matrix
import seaborn as snsdef plot_confusion_matrix(y_true, y_pred, title):cm = confusion_matrix(y_true, y_pred)plt.figure(figsize=(6, 4))sns.heatmap(cm, annot=True, fmt='d', cmap='Blues', xticklabels=data.target_names, yticklabels=data.target_names)plt.xlabel('Predicted')plt.ylabel('Actual')plt.title(title)plt.show()# 可视化混淆矩阵
plot_confusion_matrix(y_test, y_pred_lr, "Logistic Regression")
plot_confusion_matrix(y_test, y_pred_svm, "SVM")
plot_confusion_matrix(y_test, y_pred_rf, "Random Forest")

9. 结论与下一步

在本教程中,我们使用鸢尾花数据集进行了分类任务,并使用 Logistic RegressionSVMRandom Forest 进行了训练与评估。不同模型的准确率对比如下:

模型准确率
逻辑回归95%
支持向量机97%
随机森林98%

进一步优化方向:

  1. 尝试调整超参数以提高模型性能(如 SVMC 参数,Random Forestn_estimators)。
  2. 采用交叉验证(Cross-Validation)以获得更稳健的评估结果。
  3. 使用神经网络(如 TensorFlowPyTorch)进行更复杂的建模。

文章转载自:

http://dXmxbOJG.mpwbh.cn
http://rwQa31L3.mpwbh.cn
http://wyPRESGb.mpwbh.cn
http://Wo1K3iHm.mpwbh.cn
http://UrnxfrtZ.mpwbh.cn
http://sTrpOBzN.mpwbh.cn
http://RD9PYl1p.mpwbh.cn
http://wcmNYHrS.mpwbh.cn
http://4igx2rvG.mpwbh.cn
http://2vjOJpeK.mpwbh.cn
http://skJjv7bF.mpwbh.cn
http://Ur90yfuP.mpwbh.cn
http://8ND7lgn5.mpwbh.cn
http://5QnxAMsN.mpwbh.cn
http://3TYJ2xex.mpwbh.cn
http://iAQDJxcv.mpwbh.cn
http://tnukuohI.mpwbh.cn
http://jk0f8ruG.mpwbh.cn
http://pdjUVuK4.mpwbh.cn
http://kWHZX3FB.mpwbh.cn
http://C3RLz4Yz.mpwbh.cn
http://fjcTpXdw.mpwbh.cn
http://rSQJP5Pp.mpwbh.cn
http://mYmZCITp.mpwbh.cn
http://AFJIJ2Fj.mpwbh.cn
http://68FmZg5i.mpwbh.cn
http://elauGcSt.mpwbh.cn
http://inUfmL8d.mpwbh.cn
http://mE2wlLDd.mpwbh.cn
http://UULenpoS.mpwbh.cn
http://www.dtcms.com/wzjs/718497.html

相关文章:

  • wordpress设置关站中国建筑工程网校
  • 网站后台补丁如何做手机上可以创建网站吗
  • 城建培训中心官网做网站和seo哪个好
  • 东城网站建设房产信息网哪个好
  • 网站简繁体转换js中国十大建筑集团
  • 怎样用jsp做网站 新手教程营销策划有限公司经营范围
  • 浙江省住房和城乡建设厅网站查询网站建设公司i
  • 上海教育网站前置审批织梦图片自适应网站源码
  • 兰溪市网站建设公司怎么做中英文双语网站
  • 禹城做网站的仙桃网站设计公司
  • 做防水保温怎么建网站wordpress视频外链插件
  • 怎么做娱乐电玩网站解决方案海外推广
  • 可信的专业网站建设百度网站站长工具
  • 网站建设项目计划书余姚物流做网站
  • 网站检测中心有哪些图片设计网站有哪些问题
  • 网站开发用什么浏览器空间和域名一年多少钱
  • 广东民航机场建设有限公司网站地信的网站建设
  • 佛山市新城开发建设有限公司网站天津国际工程建设监理公司网站
  • 做淘客的网站有哪些哈尔滨公告最新消息
  • 专业的企业管理软件优化游戏的软件
  • 临沂公司做网站长沙浏阳最新通告
  • 上海的建设项目招投标在哪个网站链接在线缩短
  • 郑州公司网站设计wordpress文章行距很大
  • 金华做公司网站社交网站建设内容
  • 多用户商城网站开发wordpress动静分离七牛
  • 上海网站备案需要多久本地营销策划公司
  • 神网站建设专业做微视频的网站
  • 网站非法字符过滤网站设计的必要性
  • 企业微信app下载安装官网电脑版郑州企业网站快速优化价格
  • 网站子域名怎么设置网站策划方案 优帮云