当前位置: 首页 > wzjs >正文

做个网站应该怎么做建设银行网站钓鱼

做个网站应该怎么做,建设银行网站钓鱼,大连网站建设特色,黑龙江建设工程网模型名称特点适用场景sklearn 类逻辑回归 (Logistic Regression)线性分类,输出概率,可正则化防止过拟合二分类/多分类,特征线性可分linear_model.LogisticRegression感知机 (Perceptron)简单线性分类器,无概率输出线性可分数据lin…
模型名称特点适用场景sklearn 类
逻辑回归 (Logistic Regression)线性分类,输出概率,可正则化防止过拟合二分类/多分类,特征线性可分linear_model.LogisticRegression
感知机 (Perceptron)简单线性分类器,无概率输出线性可分数据linear_model.Perceptron

一.逻辑回归

# 导入逻辑回归模型
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score, f1_score, roc_auc_score, confusion_matrix, classification_report
from sklearn.model_selection import train_test_split, GridSearchCV, cross_val_score, KFold
from sklearn.preprocessing import StandardScaler
import pandas as pd
import numpy as np
from matplotlib import pyplot as plt
from scipy import stats# 设置显示选项
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
pd.set_option('display.max_rows', None)    # 显示最大行数
pd.set_option('display.max_columns', None)  # 显示最大列数
pd.set_option('display.max_colwidth', None)  # 显示的最大列宽
pd.set_option('display.width', None)  # 显示的最宽度# 导入数据
data = pd.read_excel("股票客户流失.xlsx")# 数据预处理
# 4.1 使用均值填写缺失值
print("缺失值统计:\n", data.isnull().sum())
data = data.apply(lambda col: col.fillna(col.mean()), axis=0)# 4.2 处理异常值
numeric_data = data.select_dtypes(include=[np.number])
z_scores = np.abs(stats.zscore(data.select_dtypes(include=[np.number])))  # 仅对数值型数据计算 Z-score
threshold = 3  # Z-score 阈值 3个标准差
outliers = (z_scores > threshold).any(axis=1)  # 检测异常值
print("检测到的异常值行索引:\n", data[outliers].index.tolist())  # 输出异常值的行索引
print(data[outliers])
data = data[~outliers]  # 移除异常值# 划分特征和目标变量
X = data.drop("是否流失", axis=1)
y = data["是否流失"]# 4.3 将数据划分为训练集与测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=0)# 4.4 创建标准化训练集与测试集
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)# 建立逻辑回归模型
model = LogisticRegression(max_iter=1000, random_state=42)# 参数网格
param_grid = {'C': [0.01, 0.1, 1, 10, 100],  # 正则化强度的倒数'penalty': ['l1', 'l2'],  # 正则化类型'solver': ['liblinear']  # 适用于小数据集的优化算法
}# 网格搜索
grid_search = GridSearchCV(estimator=model,param_grid=param_grid,cv=KFold(n_splits=5, random_state=42, shuffle=True),scoring='accuracy',  # 使用准确率作为评估指标n_jobs=-1
)
grid_search.fit(X_train, y_train)# 输出最佳参数组合
print("最佳参数组合:", grid_search.best_params_)# 使用最佳模型进行预测
best_model = grid_search.best_estimator_
y_pred = best_model.predict(X_test)# 输出测试集的评估指标
print("测试集准确率:", accuracy_score(y_test, y_pred))
print("测试集 F1 Score:", f1_score(y_test, y_pred))
print("测试集 ROC AUC Score:", roc_auc_score(y_test, y_pred))
print("混淆矩阵:\n", confusion_matrix(y_test, y_pred))
print("分类报告:\n", classification_report(y_test, y_pred))# 交叉验证
cv_scores = cross_val_score(best_model, X_train, y_train, cv=KFold(n_splits=5, random_state=42, shuffle=True), scoring='accuracy')
print(f"5折交叉验证准确率: {np.mean(cv_scores):.4f} (±{np.std(cv_scores):.4f})")

二.感知机

# 导入感知机模型
from sklearn.linear_model import Perceptron
from sklearn.metrics import accuracy_score, f1_score, roc_auc_score, confusion_matrix, classification_report
from sklearn.model_selection import train_test_split, GridSearchCV, cross_val_score, KFold
from sklearn.preprocessing import StandardScaler
import pandas as pd
import numpy as np
from matplotlib import pyplot as plt
from scipy import stats# 设置显示选项
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
pd.set_option('display.max_rows', None)    # 显示最大行数
pd.set_option('display.max_columns', None)  # 显示最大列数
pd.set_option('display.max_colwidth', None)  # 显示的最大列宽
pd.set_option('display.width', None)  # 显示的最宽度# 导入数据
data = pd.read_excel("股票客户流失.xlsx")# 数据预处理
# 4.1 使用均值填写缺失值
print("缺失值统计:\n", data.isnull().sum())
data = data.apply(lambda col: col.fillna(col.mean()), axis=0)# 4.2 处理异常值
numeric_data = data.select_dtypes(include=[np.number])
z_scores = np.abs(stats.zscore(data.select_dtypes(include=[np.number])))  # 仅对数值型数据计算 Z-score
threshold = 3  # Z-score 阈值 3个标准差
outliers = (z_scores > threshold).any(axis=1)  # 检测异常值
print("检测到的异常值行索引:\n", data[outliers].index.tolist())  # 输出异常值的行索引
print(data[outliers])
data = data[~outliers]  # 移除异常值# 划分特征和目标变量
X = data.drop("是否流失", axis=1)
y = data["是否流失"]# 4.3 将数据划分为训练集与测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=0)# 4.4 创建标准化训练集与测试集
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)# 建立感知机模型
model = Perceptron(random_state=42)# 参数网格
param_grid = {'alpha': [0.0001, 0.001, 0.01, 0.1],  # 正则化参数'max_iter': [100, 500, 1000],  # 最大迭代次数'eta0': [0.01, 0.1, 1.0],  # 学习率'penalty': ['l1', 'l2', 'elasticnet', None]  # 正则化类型
}# 网格搜索
grid_search = GridSearchCV(estimator=model,param_grid=param_grid,cv=KFold(n_splits=5, random_state=42, shuffle=True),scoring='accuracy',  # 使用准确率作为评估指标n_jobs=-1
)
grid_search.fit(X_train, y_train)# 输出最佳参数组合
print("最佳参数组合:", grid_search.best_params_)# 使用最佳模型进行预测
best_model = grid_search.best_estimator_
y_pred = best_model.predict(X_test)# 输出测试集的评估指标
print("测试集准确率:", accuracy_score(y_test, y_pred))
print("测试集 F1 Score:", f1_score(y_test, y_pred))
print("测试集 ROC AUC Score:", roc_auc_score(y_test, y_pred))
print("混淆矩阵:\n", confusion_matrix(y_test, y_pred))
print("分类报告:\n", classification_report(y_test, y_pred))# 交叉验证
cv_scores = cross_val_score(best_model, X_train, y_train, cv=KFold(n_splits=5, random_state=42, shuffle=True), scoring='accuracy')
print(f"5折交叉验证准确率: {np.mean(cv_scores):.4f} (±{np.std(cv_scores):.4f})")


文章转载自:

http://xSZCu6Cx.Lskyz.cn
http://tuhsxAby.Lskyz.cn
http://DLOu62Er.Lskyz.cn
http://A80La8Xw.Lskyz.cn
http://ZeY7e1Y0.Lskyz.cn
http://13ujyYzE.Lskyz.cn
http://n1dT9JCJ.Lskyz.cn
http://kf3lgpbB.Lskyz.cn
http://o3SBDrFs.Lskyz.cn
http://ijvxZkP7.Lskyz.cn
http://bH6ZK1P2.Lskyz.cn
http://iydYSu7D.Lskyz.cn
http://bcYvSWLq.Lskyz.cn
http://VOHKfvOq.Lskyz.cn
http://c1cMNVHM.Lskyz.cn
http://CxPyRhWp.Lskyz.cn
http://CXv91Fk9.Lskyz.cn
http://qaxdZBs5.Lskyz.cn
http://WaW97Mc7.Lskyz.cn
http://XKtKi7OB.Lskyz.cn
http://UQWPbVdd.Lskyz.cn
http://xhIi8atY.Lskyz.cn
http://AQBtQu8C.Lskyz.cn
http://5lRj5qb4.Lskyz.cn
http://AIJDTLlD.Lskyz.cn
http://oALHGQNT.Lskyz.cn
http://fkri5m9t.Lskyz.cn
http://P5bBLnft.Lskyz.cn
http://GgMnTIMB.Lskyz.cn
http://bqDvb9J2.Lskyz.cn
http://www.dtcms.com/wzjs/670592.html

相关文章:

  • 网站建设教程学习做网站默认城市
  • 阿里云如何添加新网站工信部网站域名备案信息查询
  • 网站建设静态部分报告总结拼多多分销模式
  • 江苏城乡建设学校网站信誉好的集团网站建设
  • 栖霞建设网站做网站能不能赚钱
  • 济南网站建设开发公司宝山网页设计制作
  • 捕鱼网站开发html5网站开发工具有哪些
  • 谁家网站做的好商务网站建设论文答辩ppt
  • 重庆建设银行网站首页万网域名注册官网网页版
  • 如何利用淘宝建设网站挣钱国内产品网站
  • 海外建站服务平台静安做网站的公司
  • 网站建设相关网站文章网站后台
  • 做网站代理能赚钱吗网站开发技术是什么
  • 乐清网站制作公司哪家好怎么把电脑网站做服务器吗
  • 顶呱呱做网站济南市莱芜区网站
  • 电子商务网站建设基础步骤更改host文件把淘宝指向自己做的钓鱼网站
  • 网站开发pdfwordpress安装到的数据库名称
  • 蓝色机械企业网站模板网站建设费的摊销年限
  • 如何获取所有网站免费咨询服务
  • 9免费建网站社群营销策略有哪些
  • 汕头网站优化公司电脑怎么建网站
  • 技术网站品牌推广方案包括哪些
  • 哪里医院做无痛人流便宜 咨询网站在线做网站的电脑需要什么配置
  • 电子商务网站运营流程广州住建网站
  • 咸阳做网站开发公司网站管理系统哪个最好
  • 网站设计知识准备中文安卓开发工具
  • 怎么申请 免费网站空间旅游主题网站策划书
  • 百度网址大全网站大全从化区城郊街道网站麻二村生态建设
  • 网站后台维护一般要怎么做王也头像高清
  • 做网站网页的公司网站建设好还需要续费吗