当前位置: 首页 > wzjs >正文

上海 企业网站建设个人网站怎么建立

上海 企业网站建设,个人网站怎么建立,南昌大学作风建设网站,明年房价走势最新消息房价预测是Kaggle的入门竞赛,很适合新手 竞赛网站和数据集获取:https://www.kaggle.com/competitions/house-prices-advanced-regression-techniques 1. notebook使用和数据获取 1.1 新建notebook 1.2 加载数据集 1.3 运行会话 如果模型不是很大&am…

房价预测是Kaggle的入门竞赛,很适合新手

竞赛网站和数据集获取:https://www.kaggle.com/competitions/house-prices-advanced-regression-techniques
在这里插入图片描述
在这里插入图片描述

1. notebook使用和数据获取

1.1 新建notebook

在这里插入图片描述

1.2 加载数据集

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

1.3 运行会话

在这里插入图片描述

在这里插入图片描述

如果模型不是很大,就选择CPU;有大量计算就选GPU,但是注意kaggle一个账号一周只有30h的免费GPU算力

1.4 查看数据路径

在这里插入图片描述

2. 获取数据

import pandas as pd
import numpy as np
from sklearn.linear_model import Lasso
from sklearn.metrics import mean_squared_error
from sklearn.preprocessing import StandardScaler# 1. 获取数据
train_data = pd.read_csv('/kaggle/input/house-prices-advanced-regression-techniques/train.csv')
test_data = pd.read_csv('/kaggle/input/house-prices-advanced-regression-techniques/test.csv')train_data.info()# id这一列没必要进行训练,所以要删掉但是注意保留数据集,因为提交的submission文件规定了必须有这一列
train_data = train_data.drop(labels=['Id'],axis=1)
test_id = test_data['Id']
test_data = test_data.drop(labels = ['Id'],axis=1)
print('train_data',train_data)
print('test_data',test_data)
print('test_id',test_id)

3. 数据预处理

# 2. 数据预处理# 明确一点对test和train要做相同的数据处理才可以,并且要是相同的方式
# 如果训练集用 0 填补了某些特征的缺失值,那测试集必须对 相同的列 做 相同的填充操作,否则:# 训练和测试的分布不一致,模型表现会变差# 有可能在预测时报错(比如某列是 float,但没填补造成 NaN)# 推荐做法是把test和train数据集 合并在一起预处理,然后再拆开!
# 因为:
# 某些处理(比如 One-Hot Encoding、填补类别型特征的众数等)必须统一处理
# 避免 train 和 test 出现不一致的列(比如训练集中有“PoolQC”但测试集中没有)def preprocess_data(train,test):train = train.copy()test = test.copy()# 2.1 合并test和train数据# 2.1.1 新增一列标记来源train['is_train'] = 1test['is_train'] = 0# 2.1.2 合并数据集(行合并)full = pd.concat([train,test],axis=0)# 2.2 房价数据转换:# log1p 是指自然对数函数 ln 的一种变形,其数学表达式为 log1p(x) = ln(1 + x)# 为什么使用log1p:# 房价数据可能具有较大的数值范围,使用 log1p 转换可以将数据压缩到一个较小的范围,使得模型更容易处理和收敛。例如,原始房价数据可能从几千到几百万不等,经过 log1p 转换后,数值范围会明显缩小,有助于提高模型的稳定性和准确性。# 使得数据成正态分布# 适合使用log1p的情况:# 数据呈现右偏态分布(大部分数据集中在较小的值,而少数值非常大)# 数值范围跨度大full['SalePrice'] = np.log1p(full['SalePrice'])# 2.3 缺失值填充# 我们这里使用最简单的填充方法,其实还有更合适的填充方法,这就需要去理解每个属性的含义num_cols = full.select_dtypes(include =[np.number]).columnsfull[num_cols] = full[num_cols].fillna(0)cat_cols = full.select_dtypes(include=['object']).columnsfull[cat_cols] = full[cat_cols].fillna('None')# 2.4 One-Hot编码full = pd.get_dummies(full)# 2.5 标准化scaler = StandardScaler()feature_cols = full.columns.drop(labels=['SalePrice','is_train'])full[feature_cols] = scaler.fit_transform( full[feature_cols])# 2.6 拆分数据集train_process = full[full['is_train']==1].drop(labels=['is_train'],axis=1)test_process = full[full['is_train']==0].drop(labels=['is_train'],axis=1)train_X = train_process.drop(labels=['SalePrice'],axis=1)train_y = train_process['SalePrice']test_X = test_process.drop(labels=['SalePrice'],axis=1)return train_X,train_y,test_Xtrain_X, train_y, test_X = preprocess_data(train_data,test_data)
# print(train_X, train_y, test_X)
print('Id' in train_X.columns)

4. 模型训练与预测

# 3. 模型训练
model = Lasso(alpha=0.001, random_state=42)
model.fit(train_X, train_y)# 4. 模型预测
pred = model.predict(test_X)
pred = np.expm1(pred)  # 还原log1p

5. 保存提交文件

# 5. 保存提交文件
submission = pd.DataFrame({'Id': test_id,'SalePrice': pred
})
submission.to_csv('submission22.csv', index=False)print("🎉 Submission 文件已生成!")

6. 下载提交文件

在这里插入图片描述

7. 在kaggel上提交文件

在这里插入图片描述
在这里插入图片描述

http://www.dtcms.com/wzjs/308315.html

相关文章:

  • wordpress 多站点迁移网站建设平台软件
  • 交互型网站什么平台可以推销自己的产品
  • 响应式网站建站互联网营销推广公司
  • 广州金融网站建设关键词优化一年多少钱
  • 重庆企业网站建设哪家好网络营销方法有哪些
  • wordpress网站反应慢百度问答下载安装
  • 北京公司网站制作费用网站发帖推广平台
  • 建设网站培训的ppt竞价广告是什么意思
  • 网站上线如何做公司名字外链生成器
  • 网站服务理念seo排名优化软件免费
  • 是先做网站还是先备案百度统计数据分析
  • 长沙整站优化中国第一营销网
  • 新加坡vpsseo软文代写
  • 网站域名注册网站seo最新
  • wordpress外链音乐青岛网络seo公司
  • 新吴区推荐做网站电话青岛seo排名收费
  • 好的学校网站设计网址之家
  • 寿县住房与城乡建设局网站小红书指数
  • 商标在线设计佛山做优化的网络公司
  • 别人的网站是怎么做的国内专业的seo机构
  • 美橙建站十四年今天特大新闻最新消息
  • 青岛网站建设 上流淘宝网店的seo主要是什么
  • 站长必备网站江阴企业网站制作
  • 北京南站地铁推广一次多少钱
  • 中国著名摄影网站app代理推广平台
  • b2b推广网站亚马逊关键词排名查询工具
  • 如何自己做网站做淘宝客百度搜索引擎的功能
  • seo技术软件广州网站建设方案优化
  • 陕西省平安建设网站第三方营销策划公司有哪些
  • 海外网络连接seo策略工具