当前位置: 首页 > news >正文

人工智能训练师——2.1.1题解

1.加载数据集并显示数据集的前五行

和1.1的题型一致

1)加载数据集想到pd.read_csv('文件名')

最后填入pd.read_csv('auto-mpg.csv')

2)打印前5行

想到head()函数

最后填入print (data.head())

2.检查缺失值并删除缺失值所在的行

检查缺失值

需要联想到isnull()函数,这个函数会标记数据中缺失值

然后需要对缺失值有多少个进行计数,想到.sum函数,能对缺失值进行计数

所以第一空填写data.isnull().sum()

删除缺失值

删除缺失值需要想到drop函数,

这里把全部的缺失值都删了就好,不需要单独去删某一行,所以直接使用dropna函数

所以最后填入data.dropna()即可

3.将 'horsepower' 列转换为数值类型,并(删除)处理转换中的异常值

转换成数值类型

pd.to_numeric 是 Pandas 的“强制转数字”函数

所以第一空填写pd.to_numeric

第二空删除处理转换中的异常值

因为只删除horsepower列里面的空值,所以需要用到subset

所以最后填入data.dropna(subset=['horsepower'])

4.对数值型数据进行标准化处理

fit_transform 即为一次性进行标准化处理

  1. fit:把 numerical_features 各列的

    • 均值 μ

    • 标准差 σ
      算出来存到 scaler 里。

  2. transform:对每条记录做

    z = (x – μ) / σ

    返回一个 NumPy 二维数组(形状跟原来一样)。

处理的对象为data[numerical_features]

所以最后填入scaler.fit_transform(data[numerical_features])

5.选择特征、自变量和目标变量

回归原题

根据业务需求和数据特性,选择对燃油效率预测最有用的特征:选择以下特征:'cylinders'、'displacement'、'horsepower'、'weight'、'acceleration'、'model year'、'origin'

所以第一空直接填写 ['cylinders', 'displacement', 'horsepower', 'weight', 'acceleration', 'model year', 'origin'](无需动脑,搬过来就行)

第二空就直接写data[selected_features]

将“mpg”设为目标变量并标注;

所以第三空填入data['mpg']

6.划分数据集为训练集和测试集(训练集占8成)

注意上面有from sklearn.model_selection import train_test_split

所以这空填入

train_test_split(X, y, random_state=42)

7.保存清洗和处理后的数据(不存储额外的索引号)

这空就是之前1.1里面常见的保存文件

所以填入cleaned_data.to_csv

常会跟一句index = False

http://www.dtcms.com/a/558585.html

相关文章:

  • 大学生网页设计与制作模板seo顾问服务福建
  • JavaScript 错误处理:全面解析与高效解决方案
  • 网站开发的广告国网商旅网页地址
  • 网站建设新闻++常识龙岗网站建设szaow
  • 学习RT-Thread(RT-Thread简介、RT-Thread环境搭建)
  • 外贸网站高端定做易店无忧官网
  • 手机集团网站建设洛阳网站建设优化案例
  • 建立网站一般会遇到什么问题免费设计签名软件
  • linux系统启动失败之flash异常分析
  • 2025年江西省职业院校技能大赛高职组“区块链技术应用”任务书(2卷)
  • 会外语和做网站成都最差的十大物业公司
  • wordpress多站点注册页手机怎么做网站
  • printf线程问题
  • 裂变速度提升300%!279模式如何盘活一个私域商城
  • 浙江省工程建设协会网站上海工程招标网招标公告
  • Linux用户和权限
  • 2025年 11月 每日分享
  • 网站建设应遵循的原则十大酒店管理系统
  • 襄阳网站建设首选公司哪家好潢川网站建设公司
  • 新手小白如何使用串口发送一个字符串
  • 西部数码网站建设教程母婴用品网站建设规划
  • wordpress super cacheseo关键词优化服务
  • Python---数据容器( tuple 元组)
  • 微信小程序在哪里找?seo联盟怎么赚钱
  • Windows上使用WSL2创建Ubuntu系统,实现无缝高效开发的体验
  • 好的活动策划网站华为荣耀官网手机旗舰店
  • Arthas工具快速使用
  • 网站建设要实现的目标外贸添加外链网站
  • psd简单的网站首页wordpress简单统计插件
  • 【AI基础篇】微积分在AI中的核心作用与应用浅析