当前位置：首页 > news >正文

人工智能训练师备考——2.1.2题解

news 2025/11/6 11:00:22

从2.1题型和1.1题型不完全一致，除去代码题他还有主观题，前一篇的2.1.1遗漏了，我之后会补上

备考+题解，内容会比较干，耐心学习，一起进步吧，追梦者！

代码题

1.读取一个Excel文件，并将读取到的数据存储在变量data中

题目：data = __________

经典题但是有变动，可以看到原先的数据集全是csv，现在变成读取excle文件了

所以最终填入pd.read_excle('大学生低碳生活行为的影响因素数据集.xlsx')

2.处理数据集中的缺失值

题目：initial_row_count = __________ #处理前的数据行数
data = __________ #删除缺失值所在行
final_row_count = __________ #处理后的数据行数

记录数据行数使用shape[0]函数去记录数据行数

使用第一空填入data.shape[0]

第二空删除缺失值所在行，删除使用drop，缺失值所在行，就是将缺失值全部删除所以使用dropna函数

第二空填入data.dropna()

第三空也是记录数据行数还是使用shape函数

所以第三空填入 data.shape[0]

3.删除重复行

题目：data = __________

使用drop_duplicates()函数duplicates 是重复的意思，

所以最终填入data.drop_duplicates()

4.对数据进行标准化处理

题目：from sklearn.preprocessing import StandardScaler
numerical_features = ['4.您的月生活费○≦1,000元 ○1,001-2,000元 ○2,001-3,000元 ○≧3,001元']
scaler = StandardScaler()
data[numerical_features] = __________

进行数据标准化需要使用fit_transform函数

然后对应处理的数据是numerical_features

所以最后填入scaler.fit_transform(data[numerical_features])

5.选择特征

题目：selected_features = [__________]
X = __________

特征在题目中给过

选择以下特征： 1.您的性别○男性 ○女性 2.您的年级○大一 ○大二 ○大三 ○大四 3.您的生源地○农村 ○城镇（乡镇） ○地县级城市 ○省会城市及直辖市 4.您的月生活费○≦1,000元 ○1,001-2,000元 ○2,001-3,000元 ○≧3,001元 5.您进行过绿色低碳的相关生活方式吗? 6.您觉得“低碳”，与你的生活关系密切吗？ 7.低碳生活是否会成为未来的主流生活方式？ 8.您是否认为低碳生活会提高您的生活质量？

所以第一空方括号内就填入对应的特征

最终填入selected_features = ['1.您的性别○男性 ○女性','2.您的年级○大一 ○大二 ○大三 ○大四','3.您的生源地○农村 ○城镇（乡镇） ○地县级城市 ○省会城市及直辖市','4.您的月生活费○≦1,000元 ○1,001-2,000元 ○2,001-3,000元 ○≧3,001元','5.您进行过绿色低碳的相关生活方式吗?','6.您觉得“低碳”，与你的生活关系密切吗？','7.低碳生活是否会成为未来的主流生活方式？','8.您是否认为低碳生活会提高您的生活质量？']

第二空就是将selected_features数据赋值给X

所以第二空填入data[selected_features]（注意不需要加双引号，因为他是我们已经定义好的变量而不是里面的数据）