当前位置: 首页 > news >正文

找人帮你做PPT的网站专业做网站广州

找人帮你做PPT的网站,专业做网站广州,软件班级网站建设,长沙品质网站建设优点作业: 自行学习参考如何使用kaggle平台,写下使用注意点,并对下述比赛提交代码 kaggle泰坦里克号人员生还预测 主要步骤概括如下 1. 数据加载与准备 分别读取训练集(train.csv)和测试集(test.csv) 从训练集中提取目标标签y(…

作业:

自行学习参考如何使用kaggle平台,写下使用注意点,并对下述比赛提交代码

kaggle泰坦里克号人员生还预测

主要步骤概括如下

1. 数据加载与准备
   分别读取训练集(`train.csv`)和测试集(`test.csv`)
   从训练集中提取目标标签`y`("Survived"列)
   选择6个特征字段:`["Pclass", "Sex", "SibSp", "Parch", "Fare", "Embarked"]`

2.特征预处理
  分类变量编码:对"Sex"和"Embarked"列使用`LabelEncoder`进行数值化转换
     训练集:`fit_transform`(学习映射关系并转换)
     测试集:`transform`(应用相同的映射关系)
     缺失值处理:使用中位数填充缺失值
     通过`SimpleImputer(strategy='median')`统一处理训练集和测试集

3. 模型训练*
   初始化随机森林分类器:`RandomForestClassifier`
     关键参数:100棵树(`n_estimators=100`),最大深度5(`max_depth=5`)
   使用处理后的训练特征`X`和标签`y`训练模型

4. 预测与输出
   对预处理后的测试集`X_test`进行生存预测
   将预测结果与乘客ID组合成DataFrame
   保存结果为`submission.csv`文件

核心流程总结:
> 数据加载 → 特征选择 → 分类编码 → 缺失值填充 → 训练随机森林模型 → 预测测试集 → 输出提交文件

关键特点:
统一处理训练/测试集保证数据一致性
使用简单但有效的特征工程(分类编码+中位数填充)
随机森林模型兼顾性能与效率
生成符合Kaggle竞赛要求的提交格式

import pandas as pd
from sklearn.ensemble import RandomForestClassifier
from sklearn.preprocessing import LabelEncoder
from sklearn.impute import SimpleImputer# 加载数据
train_data = pd.read_csv('./titanic/train.csv')
test_data = pd.read_csv('./titanic/test.csv')# 提取特征和标签
y = train_data["Survived"]features = ["Pclass", "Sex", "SibSp", "Parch", "Fare", "Embarked"]
X = train_data[features]
X_test = test_data[features]# 处理分类变量
label_encoders = {}
for col in ["Sex", "Embarked"]:le = LabelEncoder()# 处理训练集X[col] = le.fit_transform(X[col].astype(str))# 处理测试集X_test[col] = le.transform(X_test[col].astype(str))label_encoders[col] = le# 处理缺失值
imputer = SimpleImputer(strategy='median')
X = pd.DataFrame(imputer.fit_transform(X), columns=X.columns)
X_test = pd.DataFrame(imputer.transform(X_test), columns=X_test.columns)# 模型训练
model = RandomForestClassifier(n_estimators=100, max_depth=5, random_state=1)
model.fit(X, y)# 模型预测
predictions = model.predict(X_test)# 保存结果
output = pd.DataFrame({'PassengerId': test_data.PassengerId, 'Survived': predictions})
output.to_csv('submission.csv', index=False)

@浙大疏锦行

http://www.dtcms.com/a/517768.html

相关文章:

  • 新网站如何做百度收录wordpress 宕机
  • 小迪安全v2023学习笔记(一百三十六讲)—— Win系统权限提升篇计算机用户进程注入令牌窃取服务启动远程管理
  • 做阿里网站商丘购物网站开发设计
  • 做网站需要什么设备社区网站开发进度表
  • 唐山网站建设设计免费快速建站网站
  • 成都网站建设技术支持做网站的注意事项
  • 天津网站推广有哪些网站建设与维护教学计划
  • 黑龙江网站备案私人小工厂做网站价格
  • 做海报的话网站dw制作网站
  • logback的<maxFileSize>不会立即分割问题
  • 网站 做 app有哪些做平面设计好的网站有哪些内容
  • 网站建设张家港创新型的网站建设
  • 中山网站建设制作 超凡科技安卓上搭建wordpress
  • 网站开发怎么写东莞企业邮箱
  • 软件开发和网站建设一样吗没有场地可以注册公司吗
  • 网站域名使用代理网站改版Excel怎么做
  • 网站空间ip定制微信网站
  • wordpress信息分类系统主题整站快速排名优化
  • 直播网站是怎么做的高周波做网站
  • 男女做那种的视频网站阿里巴巴黄页网1688
  • Ubuntu系统配置静态IP
  • 零基础自己建网站南宁网站建设哪家公
  • 泰安建设厅网站建设网站德州
  • 济宁网站建设兼职怎么用自己电脑做服务器发布网站
  • 北京定制网站建设公司六年级上册如何做网站
  • 【开题答辩全过程】以 病历管理系统为例,包含答辩的问题和答案
  • 网站在哪里把公司网站 公开下载 做教程 侵权吗
  • 网站建设常态化工作机制wordpress浏览数
  • Java的final关键字
  • 网页模板快速建站工具个人网页设计作品简笔画