当前位置: 首页 > news >正文

pandas---使用教程

pd.read_csv()  函数的基本用法

import pandas as pd
df = pd.read_csv('path_to_file.csv')

读取指定路径的 CSV 文件,并将其转换为一个 DataFrame

其中,DataFrame是 Pandas 中用于处理二维表格数据的主要数据结构,类似于电子表格或者数据库中的表。


header

CSV 文件的第一行通常包含列名。如果数据没有列名,可以通过 header 参数指定:

df = pd.read_csv('path_to_file.csv', header=None)

默认header = 0,这意味着函数会将文件的第一行作为列名。

例如,假设有一个名为data.csv的文件,内容如下:

Name,Age,City
John,25,New York
Mary,30,Los Angeles

可以使用以下代码读取:

import pandas as pd
df = pd.read_csv("data.csv")
print(df.columns)

输出结果:

Index(['Name', 'Age', 'City'], dtype='object')

index_col

有时,CSV 文件中的某一列可以作为 DataFrame 的索引。通过 index_col 参数可以指定这一列:

df = pd.read_csv('path_to_file.csv', index_col='ID')
usecols

如果 CSV 文件列很多,但只需要读取其中的一部分列,可以使用 usecols 参数:

df = pd.read_csv('path_to_file.csv', usecols=['Column1', 'Column2'])

处理缺失值
默认情况下,pd.read_csv() 会将空值读取为 NaN。如果需要将空值替换为其他值,可以使用 na_values 参数。

处理不同的编码
如果 CSV 文件的编码不是 UTF-8,可以通过 encoding 参数指定正确的编码。

处理不均匀的数据
如果数据的分隔符不一致,可以使用正则表达式作为 sep 参数的值。

使用列名映射
如果列名不符合 DataFrame 的命名规则,可以通过 names 参数指定新的列名。

相关文章:

  • docker小白自存-windows系统通过docker安装n8n-nodes-puppeteer
  • 基于GPS-RTK的履带吊车跑偏检测技术方案
  • Python网络自动化API接口统一库之napalm使用详解
  • Python打卡:Day38
  • 利用云雾自动化在智能无人水面航行器中实现自主碰撞检测和分类
  • redis配置文件-redis.conf
  • 【Docker】解决:构建(docker build)或重新运行容器时,丢失apt-get update问题
  • 【Docker基础】Docker容器管理:docker ps及其参数详解
  • HexHub开发运维利器Database, Docker, SSH, SFTP
  • 数据库外连接详解:方式、差异与关键注意事项
  • 基于fpga的串口控制的音乐播放器
  • Franka 机器人在配置空间距离场实验中的突破性应用:从算法优化到动态场景适配
  • Stable Diffusion 3终极提示词库:2000个工业设计场景生成公式(2025企业级实战指南)
  • html css js网页制作成品——HTML+CSS湘菜网页设计(4页)附源码
  • Ehcache、Caffeine、Spring Cache、Redis、J2Cache、Memcached 和 Guava Cache 的主要区别
  • 自动化保护 AWS ECS Fargate 服务:使用 Prisma Cloud 实现容器安全
  • 无人机防护装置技术解析
  • 5,FreeRTOS中断管理
  • 本地部署 WordPress 博客完整指南(基于 XAMPP)
  • 替代创维GL3213S 读卡DD3118方案3.0国产 GL3224-32 TF/SD卡解码芯片