当前位置: 首页 > wzjs >正文

抛丸机网站怎么做如何在百度上发表文章

抛丸机网站怎么做,如何在百度上发表文章,三五互联网站建设怎么样,小公司根本办不了icp许可证Binary Prediction with a Rainfall Dataset 题意: 给你每天的天气信息,让你预测降雨量。 数据处理: 1.根据特征值构造天气降雨量的新特征值 2.根据时间构造月和季节特征 3.处理缺失值 建立模型: 1.建立lightgbm模型 2.建立…

Binary Prediction with a Rainfall Dataset

题意:

给你每天的天气信息,让你预测降雨量。

数据处理:

1.根据特征值构造天气降雨量的新特征值
2.根据时间构造月和季节特征
3.处理缺失值

建立模型:

1.建立lightgbm模型
2.建立xgboost模型,并进行网格搜索最佳参数模型
3.进行模型融合

代码:
import os
import sys
import warnings
import numpy as np
import pandas as pd
import seaborn
from matplotlib import pyplot as plt
import lightgbm
from sklearn.metrics import mean_squared_error, mean_absolute_error, r2_score
from sklearn.model_selection import train_test_split, GridSearchCV, cross_val_score
from xgboost import XGBRegressordef init():os.environ['TF_CPP_MIN_LOG_LEVEL'] = '3'  # 仅输出错误日志warnings.simplefilter('ignore')  # 忽略警告日志pd.set_option('display.width', 1000)pd.set_option('display.max_colwidth', 1000)pd.set_option("display.max_rows", 1000)pd.set_option("display.max_columns", 1000)def show_dataframe():print("查看特征值和特征值类型\n" + str(df_train.dtypes) + "\n" + "-"*100)print("查看前10行信息\n" + str(df_train.head()) + "\n" + "-"*100)print("查看每个特征值的各种数据统计信息\n" + str(df_train.describe()) + "\n" + "-" * 100)print("输出重复行的个数\n" + str(df_train.duplicated().sum()) + "\n" + "-" * 100)print("查看每列的缺失值个数\n" + str(df_train.isnull().sum()) + "\n" + "-" * 100)print("查看缺失值的具体信息\n" + str(df_train.info()) + "\n" + "-" * 100)print("输出X所有值出现的是什么,还有对应出现的次数\n" + str(df_train['X'].value_count()) + "\n" + "-" * 100)def show_relation(data, colx, coly): #输出某一特征值与目标值的关系if data[colx].dtype == 'object' or data[colx].dtype == 'category' or len(data[colx].unique()) < 20:seaborn.boxplot(x=colx, y=coly, data=data)else:plt.scatter(data[colx], data[coly])plt.xlabel(colx)plt.ylabel(coly)plt.show()def show_score(model_name,pred):mse = mean_squared_error(y_train, pred)mae = mean_absolute_error(y_train, pred)score = r2_score(y_train, pred)print(model_name)print(f"{'MSE':<10}{mse:<15.4f}")print(f"{'MAE':<10}{mae:<15.4f}")print(f"{'R²':<10}{score:<15.4f}")print("-"*100)if __name__ == '__main__':df_train = pd.read_csv('/kaggle/input/playground-series-s5e3/train.csv')df_test = pd.read_csv('/kaggle/input/playground-series-s5e3/test.csv')init()#df_show()df_all = pd.concat([df_train.drop(['id', 'rainfall'], axis=1), df_test.drop(['id'], axis=1)], axis=0)df_all['cha_temp'] = df_all['maxtemp']-df_all['mintemp'] #温差df_all['cha_temp_dew'] = df_all['temparature'] - df_all['dewpoint'] #温度湿度差df_all['humidity_norm'] = df_all['humidity'] / 100  #湿度转换为0-1范围df_all['precip_potential'] = (df_all['humidity_norm'] * df_all['cloud']) / (df_all['windspeed'] + 1e-5) #降水潜力指数df_all['solar_energy'] = df_all['sunshine'] * (df_all['maxtemp'] - df_all['mintemp']) #日照能量X_train = df_all[:df_train.shape[0]]Y_train = df_train['rainfall']x_train,x_val,y_train,y_test = train_test_split(X_train,Y_train,test_size=0.2,random_state=42)x_test = df_all[df_train.shape[0]:]model_lgb = lightgbm.LGBMRegressor(n_estimators=3000,  # 增加迭代次数配合早停learning_rate=0.01,  # 减小学习率num_leaves=15,  # 限制模型复杂度min_child_samples=20,  # 增加最小叶子样本数reg_alpha=0.1,  # L1正则化reg_lambda=0.1,  # L2正则化objective='regression_l1',  # 改用MAE损失verbose=100)model_lgb.fit(x_train, y_train)pred_lgb = model_lgb.predict(x_test)show_score(model_name='lgb', pred=model_lgb.predict(x_train))xgb_param_grid = {'n_estimators': [50, 100, 200],  # 树的数量'max_depth': [3, 4, 5, 6],  # 树的最大深度'learning_rate': [0.01, 0.1, 0.2],  # 学习速率'subsample': [0.8, 1.0],  # 指定每次迭代中用于训练每棵树的数据比例#'colsample_bytree': [0.8, 1.0], #指定每次迭代中用于训练每棵树的特征比例#'gamma': [0, 0.1, 0.2], #最小损失减少值#'min_child_weight': [1, 3, 5], #子节点所需的最小样本权重和#'reg_alpha': [0, 0.1, 1], #控制模型的正则化强度#'reg_lambda': [0, 0.1, 1] #控制模型的正则化强度}model_xgb = GridSearchCV(estimator=XGBRegressor(random_state=42),  # 对什么模型进行搜索超参数param_grid=xgb_param_grid,  # 超参数的候选值cv=3,  # 使用3折交叉验证)model_xgb.fit(x_train, y_train)pred_xgb = model_xgb.predict(x_test)show_score(model_name='xgb', pred=model_xgb.predict(x_train))pred_all = pred_xgbsubmission = pd.DataFrame({'id': df_test['id'],'sales': np.where(pred_all < 0, 0, pred_all)})submission.to_csv('/kaggle/working/submission.csv', index=False)
http://www.dtcms.com/wzjs/47766.html

相关文章:

  • 吉安做网站多少钱网站搜索排名优化价格
  • 河北大城县网站建设公司关键词优化哪家好
  • 蚌埠网站关键词优化百度seo整站优化
  • 苏州市住房和城乡建设局信息网站新品牌推广策略
  • 国际网站怎么做优化汽车seo是什么意思
  • 随州做网站企业网络推广平台
  • 公益网站建设方案友情链接qq群
  • 上海商城网站建设公司现在网络推广方式
  • 新潮远网站建设宜昌网站建设公司
  • 深圳网站制作公司电话如何申请网站域名流程
  • 网站用什么图片格式好哪些平台可以发布软文
  • 广州企业网站建设哪家好代运营公司靠谱吗
  • 共享ip做网站百度学术官网
  • 系统管理下载青岛seo关键词排名
  • 2023年最建议买的手机做优化的网站
  • 企业网站seo手机郴州网络推广公司排名
  • 国内最专业的设计网站建设seo关键词排名优化是什么
  • 网站推他网站代写平台
  • 正规的网站制作平台中超最新积分榜
  • 可以做幻灯片的网站html友情链接
  • 张家港企业网站制作环球网疫情最新消息
  • 猎头公司招聘信息淘宝seo对什么内容优化
  • 义乌外贸网站建设公司销售找客户最好的app
  • 重庆工程信息官网seo中文意思
  • 常州网站制作推广优化百度seo技术搜索引擎
  • 影视网站源码建设磁力最好用的搜索引擎
  • 没网站可以做快排吗seo哪里可以学
  • 西凤九网站建设的目标石家庄网站建设seo
  • wordpress调用头像南宁seo优化公司
  • 哪个网站可以帮助做数学题seo站长工具综合查询