当前位置: 首页 > wzjs >正文

深圳做h5网站网站优化招商

深圳做h5网站,网站优化招商,苏州网站推广建设,网站建设中的问题回顾一下什么叫多轮建模: 要综合判断一个模型好不好,一次随机抽样是不行的,得多次抽样建模,看看整体的性能如何才行(特别是对于这种小训练集)。 所以我的思路是,随机抽取训练集和验证集2000次…

回顾一下什么叫多轮建模:

要综合判断一个模型好不好,一次随机抽样是不行的,得多次抽样建模,看看整体的性能如何才行(特别是对于这种小训练集)。

所以我的思路是,随机抽取训练集和验证集2000次(随你),然后构建2000个ML模型(譬如2000个朴素贝叶斯),得出2000批性能参数。那怎么实现呢,下面上R语言代码,以朴素贝叶斯为例:

library(caret)
library(e1071)
library(pROC)# 加载数据集
dataset <- read.csv("X disease code fs.csv")
cat("数据集加载成功。\n")
X <- dataset[, 2:14]
Y <- dataset[, 1]# 初始化结果数据框
results <- data.frame(Random_Seed = integer(),Sensitivity_Test = numeric(),Specificity_Test = numeric(),AUC_Test = numeric(),Sensitivity_Train = numeric(),Specificity_Train = numeric(),AUC_Train = numeric()
)
cat("结果数据框初始化完成。\n")# 遍历随机种子
for (n in 1:2000) {set.seed(n)cat("设置随机种子为", n, "\n")# 划分数据集trainIndex <- createDataPartition(Y, p = 0.7, list = FALSE)X_train <- X[trainIndex, ]X_test <- X[-trainIndex, ]y_train <- Y[trainIndex]y_test <- Y[-trainIndex]cat("数据集划分为训练集和测试集。\n")# 标准化特征preProcValues <- preProcess(X_train, method = c("center", "scale"))X_train <- predict(preProcValues, X_train)X_test <- predict(preProcValues, X_test)cat("特征标准化完成。\n")# 训练朴素贝叶斯模型model <- naiveBayes(X_train, y_train)cat("朴素贝叶斯模型训练完成。\n")# 进行预测y_pred <- predict(model, X_test)y_train_pred <- predict(model, X_train)cat("完成对训练集和测试集的预测。\n")# 计算混淆矩阵cm_test <- confusionMatrix(as.factor(y_pred), as.factor(y_test))cm_train <- confusionMatrix(as.factor(y_train_pred), as.factor(y_train))cat("混淆矩阵计算完成。\n")# 计算AUC分数auc_test <- auc(as.numeric(y_test), as.numeric(y_pred))auc_train <- auc(as.numeric(y_train), as.numeric(y_train_pred))cat("AUC分数计算完成:测试集 =", auc_test, ",训练集 =", auc_train, "\n")# 提取敏感性和特异性sen_test <- cm_test$byClass["Sensitivity"]sep_test <- cm_test$byClass["Specificity"]sen_train <- cm_train$byClass["Sensitivity"]sep_train <- cm_train$byClass["Specificity"]cat("敏感性和特异性提取完成。\n")# 追加结果results <- rbind(results, data.frame(Random_Seed = n,Sensitivity_Test = sen_test,Specificity_Test = sep_test,AUC_Test = auc_test,Sensitivity_Train = sen_train,Specificity_Train = sep_train,AUC_Train = auc_train))cat("第", n, "次迭代的结果已追加。\n")
}# 保存结果到CSV
write.csv(results, "jet_NB_par.csv", row.names = FALSE)
cat("结果已保存到jet_NB_par.csv。\n")

简单解说:

(A)其实就是一个for循环语句,for (n in 1:2000) ,2000次就是2000,你要是想运行10000次,就改成10000;

(B)运行以后呢,可以看到模型在迭代,显示的是运行到第几个模型了:

(C)用代码write.csv(results, "jet_NB_par.csv", row.names = FALSE)输出成excel查看,输出地址就是你的工作路径,不懂的话可以使用代码getwd()展示出来。

(D)打开工作路径,可以发现jet_NB_par这个文件:

(E)打开文件,调整一下格式:

(F)然后可以操作了,比如test-sen排个序,看看最好的有多好;比如看看2000次的平均值和标准差:AUC平均值0.77-0.78左右。剩下的自己玩了,不说那么多了,发挥你们的妄想空间。

http://www.dtcms.com/wzjs/333422.html

相关文章:

  • wordpress如何做seo星乐seo网站关键词排名优化
  • 株洲网站关键词优化深圳网络推广seo软件
  • 网站开发出来有后台么免费制作网站app
  • 横沥镇网站建设网站搜索引擎优化情况怎么写
  • 珠宝类网站建设关键词优化seo优化
  • wordpress默认播放器徐州新站百度快照优化
  • 亚马逊站外deal网站seo排名优化怎么样
  • 网站建设的市场分析seo外包多少钱
  • 代理游戏网站google play下载安卓
  • nas云存储做视频网站足球联赛排名
  • wordpress本地写文章seo点击优化
  • 淘宝网站seo服务seo服务销售招聘
  • wordpress 片刻主题福州seo按天收费
  • 农产品网站建设结构潍坊住房公积金
  • 厦门网红打卡地优化营商环境的措施建议
  • 什么是网站建设的三次点击原则新闻类软文营销案例
  • 做网站搜索如何显示官网软文营销的宗旨是什么
  • 怎么做原创短视频网站信息流优化师证书
  • 做外贸经常用的网站考研培训
  • 香港特区政府网站 建设网络优化工程师主要做什么
  • 网站源码提取bing搜索引擎
  • 上海做个网站多少钱沪指重上3000点
  • 陕西建设集团韩城公司网站苏州网站建设公司排名
  • 完全自定义纯代码打造你的wordpress站点侧边栏互联网营销师国家职业技能标准
  • 新疆工程建设网站上查询系统培训机构查询网
  • 百度关键词网站怎么做seo排名查询工具
  • 做一元夺宝网站需要什么条件新闻最新消息10条
  • seo的优化原理seo关键词排名优化评价
  • 百度搜索排名怎么做深圳抖音seo
  • 外贸网站建设推广公司友情链接又称