当前位置: 首页 > news >正文

网站建设如何上传文件检测网站是否被墙

网站建设如何上传文件,检测网站是否被墙,展览展厅设计案例,兰州网络seo✅ 今日目标 回顾整个本周数据分析 & 建模流程学会训练第二种模型:决策树(Decision Tree)掌握多模型对比评估的方法与实践输出综合对比报告:准确率、精确率、召回率、F1 等指标为后续模型调优与扩展打下基础 🪜 一…

✅ 今日目标

  • 回顾整个本周数据分析 & 建模流程
  • 学会训练第二种模型:决策树(Decision Tree)
  • 掌握多模型对比评估的方法与实践
  • 输出综合对比报告:准确率、精确率、召回率、F1 等指标
  • 为后续模型调优与扩展打下基础

🪜 一、本周流程快速回顾

步骤内容
第1天高级数据操作(索引、透视、变形)
第2天缺失值和异常值处理
第3天多表合并与连接
第4天特征工程(编码、归一化、时间)
第5天数据集拆分(训练集 / 测试集)
第6天逻辑回归模型构建与评估
第7天🤖 多模型对比评估(今天)

🌲 二、训练决策树分类器

from sklearn.tree import DecisionTreeClassifiertree = DecisionTreeClassifier(random_state=42)
tree.fit(X_train, y_train)
y_pred_tree = tree.predict(X_test)

⚖️ 三、模型对比评估

from sklearn.metrics import classification_reportprint("📋 Logistic 回归:")
print(classification_report(y_test, y_pred_log))print("📋 决策树模型:")
print(classification_report(y_test, y_pred_tree))

📊 可视化对比(可选)

import matplotlib.pyplot as pltmodels = ["Logistic", "DecisionTree"]
accuracies = [accuracy_score(y_test, y_pred_log),accuracy_score(y_test, y_pred_tree),
]plt.bar(models, accuracies, color=["skyblue", "lightgreen"])
plt.title("模型准确率对比")
plt.ylabel("Accuracy")
plt.show()

🧪 今日练习建议(脚本名:compare_models.py

  1. 读取本周生成的训练 / 测试数据

  2. 同时训练逻辑回归与决策树模型

  3. 输出各自的评估指标(Accuracy、Precision、Recall、F1)

  4. (可选)将结果写入一个 CSV 或图表可视化

  5. 思考不同模型优劣,以及如何选择合适模型

    # compare_models.py
    import pandas as pd
    from sklearn.linear_model import LogisticRegression
    from sklearn.tree import DecisionTreeClassifier
    from sklearn.metrics import (accuracy_score,classification_report,confusion_matrix
    )
    import matplotlib.pyplot as plt
    import seaborn as sns
    import osplt.rcParams['font.family'] = 'Arial Unicode MS'  # Mac 用户可用
    plt.rcParams['axes.unicode_minus'] = False# 1. 加载训练与测试数据
    data_dir = "data/model"
    X_train = pd.read_csv(os.path.join(data_dir, "X_train.csv"))
    X_test = pd.read_csv(os.path.join(data_dir, "X_test.csv"))
    y_train = pd.read_csv(os.path.join(data_dir, "y_train.csv")).values.ravel()
    y_test = pd.read_csv(os.path.join(data_dir, "y_test.csv")).values.ravel()# 2. 初始化模型
    log_model = LogisticRegression()
    tree_model = DecisionTreeClassifier(random_state=42)# 3. 模型训练
    log_model.fit(X_train, y_train)
    tree_model.fit(X_train, y_train)# 4. 模型预测
    y_pred_log = log_model.predict(X_test)
    y_pred_tree = tree_model.predict(X_test)# 5. 评估结果
    print("📋 Logistic 回归评估报告:")
    print(classification_report(y_test, y_pred_log))print("\n🌳 决策树评估报告:")
    print(classification_report(y_test, y_pred_tree))# 6. 准确率对比
    acc_log = accuracy_score(y_test, y_pred_log)
    acc_tree = accuracy_score(y_test, y_pred_tree)# 7. 可视化混淆矩阵
    plt.figure(figsize=(10, 4))plt.subplot(1, 2, 1)
    sns.heatmap(confusion_matrix(y_test, y_pred_log, labels=[0, 1]), annot=True, fmt="d", cmap="Blues",xticklabels=["0", "1"], yticklabels=["0", "1"])
    plt.title("Logistic 回归 - 混淆矩阵")
    plt.xlabel("预测", fontproperties="Arial Unicode MS")
    plt.ylabel("真实", fontproperties="Arial Unicode MS")plt.subplot(1, 2, 2)
    sns.heatmap(confusion_matrix(y_test, y_pred_tree, labels=[0, 1]), annot=True, fmt="d", cmap="Greens",xticklabels=["0", "1"], yticklabels=["0", "1"])
    plt.title("决策树 - 混淆矩阵")
    plt.xlabel("预测", fontproperties="Arial Unicode MS")
    plt.ylabel("真实", fontproperties="Arial Unicode MS")plt.tight_layout()
    plt.show()# 8. 准确率柱状图
    plt.figure(figsize=(5, 4))
    plt.bar(["Logistic", "Decision Tree"], [acc_log, acc_tree], color=["skyblue", "lightgreen"])
    plt.title("模型准确率对比")
    plt.ylabel("Accuracy")
    plt.ylim(0, 1)
    plt.grid(axis='y', linestyle='--', alpha=0.7)
    plt.tight_layout()
    plt.show()# 9. 汇总结果(可选保存)
    results_df = pd.DataFrame({"模型": ["Logistic", "Decision Tree"],"准确率": [acc_log, acc_tree]
    })
    os.makedirs("data/result", exist_ok=True)
    results_df.to_csv("data/result/model_comparison.csv", index=False)
    print("\n✅ 对比结果已保存:data/result/model_comparison.csv")
    

    结果输出:

    📋 Logistic 回归评估报告:precision    recall  f1-score   support0       1.00      1.00      1.00         71       1.00      1.00      1.00        13accuracy                           1.00        20macro avg       1.00      1.00      1.00        20
    weighted avg       1.00      1.00      1.00        20🌳 决策树评估报告:precision    recall  f1-score   support0       1.00      1.00      1.00         71       1.00      1.00      1.00        13accuracy                           1.00        20macro avg       1.00      1.00      1.00        20
    weighted avg       1.00      1.00      1.00        20✅ 对比结果已保存:data/result/model_comparison.csv
    

    可视化混淆矩阵:
    在这里插入图片描述

    准确率柱状图:
    在这里插入图片描述

    data/result/model_comparison.csv:
    在这里插入图片描述
    PS:可以使用下面的代码生成训练/测试集:

    import pandas as pd
    import numpy as np
    from sklearn.model_selection import train_test_split
    import os# 构造示例数据
    np.random.seed(42)
    size = 100
    df = pd.DataFrame({"成绩": np.random.randint(40, 100, size=size),"性别": np.random.choice(["男", "女"], size=size)
    })# 增加派生特征
    df["成绩_标准化"] = (df["成绩"] - df["成绩"].mean()) / df["成绩"].std()
    df["是否及格_数值"] = (df["成绩"] >= 60).astype(int)
    df["性别_男"] = (df["性别"] == "男").astype(int)
    df["性别_女"] = (df["性别"] == "女").astype(int)# 特征与标签
    X = df[["成绩_标准化", "性别_男", "性别_女", "是否及格_数值"]]
    y = df["是否及格_数值"]# 拆分数据
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)# 保存路径
    os.makedirs("data/model", exist_ok=True)
    X_train.to_csv("data/model/X_train.csv", index=False)
    X_test.to_csv("data/model/X_test.csv", index=False)
    y_train.to_csv("data/model/y_train.csv", index=False)
    y_test.to_csv("data/model/y_test.csv", index=False)
    

🧾 今日总结

  • 理解模型评估不止准确率,更要看精确率与召回率
  • 决策树可捕捉非线性关系,但易过拟合
  • 模型选择应结合业务背景、样本数量、可解释性等因素
http://www.dtcms.com/a/481313.html

相关文章:

  • 网站建设 引导电商网站开发价格
  • 企业建设网站流程郑州网站推广公司信息
  • 网站建设过程中要注意沟通深圳品牌策划公司计划书
  • 商务网站运营与管理孟州网站开发app
  • 怎么看网站开发语言响应式网站模板免费
  • 网站建设分工东营网站建设运营公司
  • 德州企业认证网站建设网站建设需要注册42类吗
  • 网站js文件夹seo网站设计
  • 如何制作官方网站泾川建设路网站
  • 如何备份wordpress站点免费ppt模板下载 知乎
  • 网站开发与维护课程设计旅游社网站建设规划书
  • 网站建设人力调配范文做淘宝网站要求与想法
  • 大型门户网站建设一般多少钱网站功能模块设计怎么写
  • 手机网站建设一般要多少钱深圳设计公司十大排名
  • 柳州论坛网站建设百度网页打不开无法访问怎么办
  • 个人网站建设规划谢馥春网站建设的优势
  • 海北公司网站建设价格低做微网站是订阅号还是服务号号
  • 黄冈网站推广厂家怎么做农家乐联盟网站
  • 专题网站建设意义何在企业门户是什么意思
  • 宁波住房和建设局网站首页wordpress绿色两栏响应式主题
  • 惠州网站制作维护写出网站开发的基本流程
  • cp网站建设软文营销的定义
  • jsp做网站多吗小程序样式模板
  • 专业的营销型网站定制人网站建站
  • 南京市网站建设公司西安企业建站公司
  • 什么网站比较吸引流量wordpress爬虫
  • 做网站推广一年多少钱桂林山水甲天下是哪个景点
  • 广东企业网站建设多少钱丰台新乡网站建设
  • 我们提供的网站建设如何查询到某网站开发商
  • asp.net制作的网站开发定制高端网站