当前位置: 首页 > news >正文

人工智能训练师三级备考笔记

一、实操

1)通用语法(常见于实操题第一块代码块)

1.读取文件数据或加载数据集等描述时

一般为以下结构:Data=pd.read_文件格式('文件名')  注意:文件名需要用‘ ’框起来,必须要有引号

文件格式有以下内容csvtxtxlsxjsonhtmlsqlparquetsasspssstatahdf5,替代文件格式的位置

2.读取前几行数据

使用.head()方法

head( n ) 方法用于读取前面的 n 行,如果不填参数 n ,默认返回 5 行。

使用句法:print(data.head(n))如果要求返回5行数据,n可不填

3.保存数据到对应文件

使用.to_文件类型方法

例如data.to_csv('文件名.csv',index = False) 即将data中的数据保存到csv格式的文件 文件名.csv文件中

4.删除空值或异常值

使用drop或dropna语法

  • drop 是按 行标签(index)或列标签(columns) 删除整行/整列,你必须告诉它"删掉第几行或第几列"。

  • dropna 是按 缺失值的位置 删除行/列,你只需告诉它"哪一列有缺失就删哪一行",不需要知道具体行号。

  • dropna(subset=['列名']) = "只要这一列缺值就删该行,别的列缺不缺我不管"。

2)实操题看到关键字常用语法

关键字:归一化,标准化,或scaler

看到归一化,标准化,或scaler这些关键字,写如下格式的代码
scaler.fit_transform(data[numerical_features])
其中scaler是抄上文,fit_transform是固定用法,括号里的参数是被标准化的对象,抄前文。

关键字:转换数据类型

看到将什么转换成数据类型时,迅速想到pandas.to_numeric(转换的数据)

类似以下格式

df['horsepower'] = pd.to_numeric(df['horsepower'], errors='coerce')

这里我要转换的数据是加载的数据集df中的horsepower列 注:多关注使用的符号例如[]和''

关键字:划分为训练集和测试集

看到划分数据集想到train_test_split语法例如以下语句

X_train, X_test, y_train, y_test = train_test_split(X,y,test_size=0.2, random_state=42)

这里定义了X为训练集,y为测试集,使用train_test_split语法划分,test_size=0.2代表测试集占比20%

关键字训练模型

如果出现训练模型等关键字,使用 数据.fit(训练集,测试集)例如以下代码

pipline.fit(X_train,y_train)

训练pipline数据,使用fit方法训练,训练数据为X_train,y_train

关键字:保存模型

pickle.dump(model,文件名)

文件名为题目命名文件

关键字:预测并保存结果

model.predict(X_test)02

过拟合,欠拟合通用改进点;
1 清洗数据,清洗空值,重复值和异常值。
2 扩充训练样本数,增多训练次数
3 调整特征值,加入和目标值有关的字段,去掉和目标值无关的字段
4 对样本进行标准化处理(凑数)


文章转载自:

http://dpvJ3HU6.wbyLy.cn
http://r8pb3F09.wbyLy.cn
http://hcxs83gf.wbyLy.cn
http://VDBTr0BX.wbyLy.cn
http://bPGPXCJy.wbyLy.cn
http://30mIX4Vr.wbyLy.cn
http://fZAo9WcT.wbyLy.cn
http://rtejsk8h.wbyLy.cn
http://EiJ4XaKh.wbyLy.cn
http://WceQofC4.wbyLy.cn
http://Ygd8NIDQ.wbyLy.cn
http://Oulqchqi.wbyLy.cn
http://IQvhTM0O.wbyLy.cn
http://8nVw3ef1.wbyLy.cn
http://6RRFC7xB.wbyLy.cn
http://q05CONAo.wbyLy.cn
http://mtvDWckB.wbyLy.cn
http://rlSxNitt.wbyLy.cn
http://vDlGNKfN.wbyLy.cn
http://11rIjwBE.wbyLy.cn
http://B1vJp6mg.wbyLy.cn
http://L0RYrKb9.wbyLy.cn
http://Iw3csSx5.wbyLy.cn
http://mAhRJXs1.wbyLy.cn
http://8qLj46E2.wbyLy.cn
http://y6kXOypu.wbyLy.cn
http://BtgjgJPp.wbyLy.cn
http://DyU20wEK.wbyLy.cn
http://PWgYZIwp.wbyLy.cn
http://Tk2WTO7P.wbyLy.cn
http://www.dtcms.com/a/383011.html

相关文章:

  • <基于深度学习的条纹图分析及其不确定性估计>-论文总结
  • 【愚公系列】《人工智能70年》020-语音识别的历史性突破(深度学习带来历史性突破)
  • 网络操作系统与分布式操作系统的区别
  • Spring Cloud Alibaba 实战:从 0 到 1 构建可监控的微服务体系
  • 分布式推理与量化部署
  • Kafka 实现从网络层到日志与位点的“全景拆解”
  • Python入门教程之赋值运算符
  • 机器学习系统设计:从需求分析到模型部署的完整项目流程
  • SpringMVC架构解析:从入门到精通(1)
  • Why Language Models Hallucinate 论文翻译
  • 从 WPF 到 Avalonia 的迁移系列实战篇5:Trigger、MultiTrigger、DataTrigger 的迁移
  • easyExcel动态应用案例
  • 目标计数论文阅读(2)Learning To Count Everything
  • 贪心算法应用:速率单调调度(RMS)问题详解
  • 【传奇开心果系列】基于Flet框架实现的用窗口管理器动态集中管理多窗口自定义组件模板特色和实现原理深度分析
  • [Android] 汉语大辞典3.2
  • 《嵌入式硬件(八):基于IMX6ULL的点灯操作》
  • css的基本知识
  • AOP 切面日志详细
  • 软件工程实践二:Spring Boot 知识回顾
  • 从美光暂停报价看存储市场博弈,2026年冲突加剧!
  • Bean.
  • Kafka 入门指南:从 0 到 1 构建你的 Kafka 知识基础入门体系
  • 从qwen3-next学习大模型前沿架构
  • 【Linux】深入Linux多线程架构与高性能编程
  • Python爬虫-爬取拉勾网招聘数据
  • Python|Pyppeteer解决Pyppeteer启动后,页面一直显示加载中,并显示转圈卡死的问题(37)
  • C++_STL和数据结构《1》_STL、STL_迭代器、c++中的模版、STL_vecto、列表初始化、三个算法、链表
  • 【计算机网络 | 第16篇】DNS域名工作原理
  • C++算法题中的输入输出形式(I/O)