当前位置: 首页 > news >正文

【数据分析】读取文件

3. 读取指定列

针对只需要读取数据中的某一列或多列的情况,pd.read_csv()函数提供了一个参数:usecols,将包含对应的columns的列表传入该参数即可。

上面,我们学习了读取 "payment"  "items_count" 这两列的数据。
当然,Pandas也提供了to_csv()函数,用于将DataFrame转换为CSV数据。

# 导入pandas模块,并以"pd"为该模块的简写

import pandas as pd

# 使用pd.read_csv()函数和usecols参数

# 读取路径为 "/Users/yequ/电商数据清洗.csv" 的CSV文件里的"payment"和"items_count"这两列中的数据

# 并将结果赋值给变量data

data = pd.read_csv("/Users/yequ/电商数据清洗.csv", usecols=["payment","items_count"])

# 将data保存到指定路径

data.to_csv("/Users/yequ/电商数据清洗2.csv")

ps:对DataFrame对象使用to_csv()函数,将文件保存路径作为参数,即可将DataFrame保存到指定的文件路径,并存储为后缀名是.csv的文件。

如图,我们在调用to_csv()若只设置路径参数,会将行索引信息写入CSV文件的第1列。

to_csv()函数和read_csv()函数类似,除了路径这个参数外,还有大量可选参数可以选用。

对于to_csv()函数,我们再简单了解2个可选参数。

对于前面的情况,我们通过设置参数index=False,这样就不会将行索引信息写入第一列。

# 导入pandas模块,并以"pd"为该模块的简写

import pandas as pd

# 使用pd.read_csv()函数和usecols参数

# 读取路径为 "/Users/yequ/电商数据清洗.csv" 的CSV文件里的"payment"和"items_count"这两列中的数据

# 并将结果赋值给变量data

data = pd.read_csv("/Users/yequ/电商数据清洗.csv", usecols=["payment","items_count"])

# 将data保存到指定路径,并不将行索引信息写入第一列

data.to_csv("/Users/yequ/电商数据清洗2.csv",index=False)

同样的道理,使用to_csv()函数,也有可能因为中文字符的编码问题,造成生成的csv文件乱码。

此时,我们可以将参数encoding设置为"utf-8-sig"。

格式:encoding="utf-8-sig"

示例代码:

import pandas as pd

data = pd.read_csv("/Users/yequ/电商数据清洗.csv", usecols=["payment","items_count"])

# 将data保存到指定路径

data.to_csv("/Users/yequ/电商数据清洗2.csv",encoding="utf-8-sig")

保存CSV文件

Pandas也提供了to_csv()函数,用于将DataFrame转换为CSV数据。
必选参数:要保存的CSV文件的文件路径
可选参数:
1. 设置保存编码格式 encoding="utf-8-sig"
2. 不将行索引写入第一列index = False

与读取CSV文件相似, Excel文件的读取也差不多。

相关文章:

  • 部署 T-Pot:构建高级威胁捕获与分析平台的精妙指南
  • DNS服务和实验
  • uniapp 多环境配置打包,比较优雅的解决方案,全网相对优解
  • 自动化立体仓库堆垛机HMI屏幕程序施耐德HMIGXU系列 Vijeo Designer功能设计
  • 【为什么游戏能使人上瘾】
  • Windows安全日志Defender 的配置被修改5007
  • 《灵珠觉醒:从零到算法金仙的C++修炼》卷三·天劫试炼(53)炼妖壶收子集 - 子集问题(位运算与回溯)
  • transformer入门详解
  • 设计模式之原型模式:原理、实现与应用
  • python习题卷1
  • 【从零开始学习计算机科学】算法分析(一)算法、渐进分析、递归分析
  • JAVA实战开源项目:教学辅助平台(Vue+SpringBoot) 附源码
  • Word:双栏排版操作步骤及注意事项
  • 3个 Vue $set 的应用场景
  • 查询MySQL表占用磁盘大小的方法
  • 重生之我在学Vue--第14天 Vue 3 国际化(i18n)实战指南
  • vue-常用指令 | 常用指令的修饰符
  • DNS查询
  • Mysql与ElasticSearch间的数据同步场景模拟
  • Blender-MCP服务源码4-初始化项目解读
  • 韦尔股份拟更名豪威集团:更全面体现公司产业布局,准确反映未来战略发展方向
  • 特朗普与普京开始电话会谈,稍后将致电泽连斯基
  • 加快推进科技服务业高质量发展,九部门联合发文
  • 中共中央、国务院印发《党政机关厉行节约反对浪费条例》
  • 高飞已任南航集团党组副书记
  • 信俗与共:清代新疆回疆儒释道庙宇的中华政教