当前位置: 首页 > wzjs >正文

unity做网站网上的推广

unity做网站,网上的推广,大鱼号自媒体平台注册,北京网站优化哪家公司好​ 作业 自行学习参考如何使用kaggle平台,写下使用注意点,并对下述比赛提交代码 kaggle泰坦里克号人员生还预测 一、流程 思路概述 数据加载 :读取泰坦尼克号的训练集和测试集。数据预处理 :处理缺失值、对分类变量进行编码、…

作业

自行学习参考如何使用kaggle平台,写下使用注意点,并对下述比赛提交代码
kaggle泰坦里克号人员生还预测

一、流程

思路概述

  1. 数据加载 :读取泰坦尼克号的训练集和测试集。
  2. 数据预处理 :处理缺失值、对分类变量进行编码、提取特征等。
  3. 模型训练 :选择合适的机器学习模型并在训练集上进行训练。
  4. 模型预测 :使用训练好的模型对测试集进行预测。
  5. 结果提交 :将预测结果保存为符合 Kaggle 要求的 CSV 文件。

个人感觉kaggle竞赛平台是根据你自己交的.csv文件去和平台上完全正确的.csv文件进行比对。
从官网上下载数据集,判断每个特征的含义,以及数据类型,属性。

特征名称中文含义数据类型详细解释
PassengerId乘客编号整数每个乘客独一无二的标识,用于区分不同乘客
Survived是否幸存整数目标变量,0 表示未幸存,1 表示幸存
Pclass客舱等级整数乘客所购船票对应的舱位等级,1 为一等舱,2 为二等舱,3 为三等舱。一般等级越高,乘客社会经济地位越高
Name乘客姓名字符串包含乘客的全名,可能包含头衔信息,如 Mr.Miss.
Sex性别字符串乘客的性别,取值为 male(男性)或 female(女性)
Age年龄浮点数乘客的年龄,部分数据存在缺失值。年龄可能影响生存概率,例如儿童和老人可能在救援中更受照顾
SibSp兄弟姐妹及配偶数量整数乘客在船上的兄弟姐妹和配偶的总数。反映乘客的家庭关系情况
Parch父母及子女数量整数乘客在船上的父母和子女的总数。同样反映乘客的家庭关系情况
Ticket船票编号字符串乘客所持船票的唯一编号,格式多样,可能包含字母和数字
Fare船票票价浮点数乘客购买船票所支付的费用,与客舱等级可能存在关联
Cabin客舱编号字符串乘客所在的客舱编号,大量数据存在缺失值。不同客舱位置可能影响乘客在灾难发生时逃生的难易程度
Embarked登船港口字符串乘客登船的港口,C 代表瑟堡(Cherbourg),Q 代表皇后镇(Queenstown),S 代表南安普顿(Southampton)

二、解题代码

逻辑都写在注释里面了,参考别人的代码,不过可以看出来是很标准的机器学习训练及测试的代码。

import pandas as pd
from sklearn.ensemble import RandomForestClassifier
from sklearn.preprocessing import LabelEncoder
from sklearn.impute import SimpleImputer# 加载数据
train_data = pd.read_csv('./titanic/train.csv')
test_data = pd.read_csv('./titanic/test.csv')# 提取特征和标签
y = train_data["Survived"]features = ["Pclass", "Sex", "SibSp", "Parch", "Fare", "Embarked"]
X = train_data[features]
X_test = test_data[features]# 处理分类变量
label_encoders = {}
for col in ["Sex", "Embarked"]:le = LabelEncoder()# 处理训练集X[col] = le.fit_transform(X[col].astype(str))# 处理测试集X_test[col] = le.transform(X_test[col].astype(str))label_encoders[col] = le# 处理缺失值
imputer = SimpleImputer(strategy='median')
X = pd.DataFrame(imputer.fit_transform(X), columns=X.columns)
X_test = pd.DataFrame(imputer.transform(X_test), columns=X_test.columns)# 模型训练
model = RandomForestClassifier(n_estimators=100, max_depth=5, random_state=1)
model.fit(X, y)# 模型预测
predictions = model.predict(X_test)# 保存结果
output = pd.DataFrame({'PassengerId': test_data.PassengerId, 'Survived': predictions})
output.to_csv('submission.csv', index=False)

​​​​在这里插入图片描述

http://www.dtcms.com/wzjs/547329.html

相关文章:

  • 西安做网站的公司报价施工企业样板先行制度
  • 怎么在网站上做图片轮播建设工程标准 免费下载网站
  • 免费追剧网站大全传媒的域名做个什么网站
  • 纳雍网站建设公司做一般的公司网站需要多少钱
  • 做企业网站需要维护费吗广告设计公司怎么样
  • 网站认证怎么做网站制作找云优化
  • 网站建设设计培训班大学网站建设宣传方案
  • 网站建设及外包广州手机网站开发报价
  • 网站开发 哪家好跨境电商怎么推广引流
  • 怎么在百度建立自己的网站服务器租用网站模版
  • 推荐聊城网站建设golang 网站开发 开源
  • 网站关键字排名怎么做哈尔滨门户网站是什么
  • 温州网站建设模板下载免费阿里域名注册查询
  • 怎么做公众号网站铜山徐州网站开发
  • 网站建设出题优化的近义词
  • 做公司网站需要的材料有哪些新开元电销系统
  • 适合大学生做兼职的网站有哪些商城网站入驻系统
  • 设计师服务平台网站中国电信企业邮箱登录入口
  • 国外手机设计网站o2o有哪些电商平台
  • 自动采集网站php源码凡科网站建站后 怎么编辑自己的代码源
  • 网站工信部本案货架网站开发
  • 宁波集团网站建设wordpress 看不到图片
  • 巩义做网站汉狮网络拟定一个物流网站建设方案
  • 阜宁网站建设找哪家好手机百度高级搜索入口在哪里
  • 网页设计与制作教程机械工业出版社百度关键词优化
  • 做网站能赚钱吗知乎python做网站原理
  • 用html5做的静态网站福田公司简介
  • 乐清建网站wordpress 目录 导航站
  • 做网站的哪里好兴城泳装电子商务网站建设
  • 杭州企业网站seo图行天下免费素材网