当前位置: 首页 > news >正文

【数据分析】读取文档(读取Excel)

与读取CSV文件相似, Excel文件的读取也差不多。

因为Excel文件读取和CSV文件读取之间的区别就是一个词Excel。但它们的参数不完全通用,例如:encoding。

在学习读取Excel文件前,我们需要先安装一个用于读取Excel文件的辅助工具:xlrd 模块。

在终端中输入pip install xlrd==1.2.0安装xlrd模块。

读取Excel文件

在pandas模块中,读取Excel文件主要使用pd.read_excel()函数。

将 必选参数 - Excel文件的路径传入该函数中,便可以得到对应的DataFrame格式的数据。

下面是一个简单的示例:将一份2019年的超市销售订单数据的Excel文件路径传入pd.read_excel()函数后,得到了该数据对应的DataFrame格式的数据。
此时,读取出的数据会被自动添加默认从0开始的行索引index和列索引columns,并且columns默认是原来数据的第一行。

面对特殊情况的处理

和读取CSV文件一样,pd.read_excel()函数也为我们提供了大量的可选参数来处理形形色色的情况。

之前学习的参数也可以用在pd.read_excel()函数中。

除此之外,还有1个特殊的场景是只在处理Excel文件时能遇到的。

接下来,我们将通过分析这个场景来帮助大家理解pd.read_excel()函数中另一个最常用的可选参数。

读取指定工作表

当Excel文件里有多个工作表时,默认情况下,pd.read_excel()函数会读取第一个工作表。
but  now,我们想要具体分析该超市的销售情况,那么就需要读取Excel文件中的第二个工作表 - "销售订单数据"。

读取指定工作表-sheet_name

当我们需要读取指定工作表时,pd.read_excel()函数提供了一个参数:sheet_name,将要读取的工作表名称作为字符串传入该参数即可。

# 导入pandas模块,并以"pd"为该模块的简写

import pandas as pd

# TODO 使用pd.read_excel()函数和sheet_name参数

# 读取路径为 "/Users/yequ/2019年4月销售订单.xlsx" 的Excel文件里:"销售订单数据" 这个工作表

# 并将结果赋值给变量data

data = pd.read_excel( "/Users/yequ/2019年4月销售订单.xlsx",sheet_name="销售订单数据")

# 使用print()输出变量data

print(data)

总结:

读取Excel文件

在pandas模块中,读取Excel文件主要使用pd.read_excel()函数。
当我们需要读取指定工作表时,pd.read_excel()函数提供了一个参数:sheet_name,将要读取的工作表名称作为字符串传入该参数即可

相关文章:

  • Flux 文生图技术解析与部署实践
  • Python 魔法方法介绍
  • 网络安全常识科普(百问百答)
  • 每日Attention学习26——Dynamic Weighted Feature Fusion
  • 双指针算法专题之——有效三角形的个数
  • 《Python深度学习》第二讲:深度学习的数学基础
  • 老牌软件,方便处理图片,量大管饱。
  • 4大观点直面呈现|直播回顾-DeepSeek时代的AI算力管理
  • 《灵珠觉醒:从零到算法金仙的C++修炼》卷三·天劫试炼(35)山河社稷图展开 - 编辑距离(字符串DP)
  • 向量数据库技术系列二-Milvus介绍
  • 【linux篇】--linux常见指令
  • 简单爬虫--框架
  • [蓝桥杯 2023 省 A] 买瓜 --暴力DFS+剪枝优化
  • L1-078 吉老师的回归(C++)
  • 202503执行jmeter压测数据库(ScyllaDB,redis,lindorm,Mysql)
  • 前缀和的例题
  • 麒麟系统使用-安装 SQL Developer
  • 【MIMIC数据库教程】十二、使用Python提取所有患者的高密度脂蛋白(HDL)指标
  • 【C++】 —— 笔试刷题day_6
  • [网络] socket编程--udp_echo_server
  • 独立网站商城/大连网站建设
  • 三乡有做网站的师傅吗/国内免费ip地址
  • wordpress本地调试慢/湖南正规seo优化
  • 大丰网站制作/长沙seo网站管理
  • csgo翻硬币网站开发/百度指数搜索指数的数据来源
  • 宝安网站建设公司/医院网站建设方案