当前位置: 首页 > news >正文

深度学习中主要库的使用:(一)pandas,读取 excel 文件,支持主流的 .xlsx/.xls 格式

pandas

其中的 pd.read_excel() 函数可以读取 excel 文件,支持主流的 .xlsx/.xls 格式。

想要读取 .xlsx 文件就需要再安装 openpyxl 库,想要读取 .xls 文件就需要再安装 xlrd 库。

import pandas as pdfile_path = 'test1.xlsx'
data = pd.read_excel(path, engine='openpyxl')
print(data)

读取的结果是一个 DataFrame 对象,DataFramepandas 中用于处理表格数据的主要数据结构,它具有丰富的属性和方法,具体如下:

1)常用属性

  1. data.shape

    返回一个元组,表示 DataFrame 的维度(行数和列数)。

  2. data.columns

    返回一个 Index 对象,包含 DataFrame 的列标签。

  3. data.index

    返回一个 Index 对象,包含 DataFrame 的行标签。

  4. data.dtypes

    返回一个 Series,显示每列的数据类型。

  5. data.size

    返回 DataFrame 中元素的总数(行数乘以列数)。

  6. data.ndim

    返回 DataFrame 的维度数(通常是 2)。

  7. data.empty

    返回一个布尔值,指示 DataFrame 是否为空。

2)常用方法

  1. data.head(n)

    返回前 n 行数据(默认是 5 行)。

  2. data.tail(n)

    返回后 n 行数据(默认是 5 行)。

  3. data.describe()

    返回数值列的统计摘要(如计数、均值、标准差、最小值、四分位数、最大值)。

  4. data.info()

    打印 DataFrame 的简要摘要,包括行数、列数、列类型和非空值计数。

  5. data.isnull()

    返回一个布尔型 DataFrame,指示每个元素是否为 NaN

  6. data.dropna()

    删除包含 NaN 的行。

  7. data.fillna(value)

    用指定的值填充 NaN

  8. data.groupby(column)

    按指定列对 DataFrame 进行分组。

  9. data.pivot_table(values, index, columns)

    创建一个数据透视表。

  10. data.apply(func)

    沿 DataFrame 的轴应用函数。

3)示例

import pandas as pdfile_path = 'test1.xlsx'
data = pd.read_excel(file_path, engine='openpyxl')# 打印形状
print("Shape:", data.shape)
print("----------------------------")
# 打印列标签
print("Columns:", data.columns)
print("----------------------------")
# 打印前两行
print("Head:\n", data.head(2))# -------------------------------------------------------------------------------------------------------------------------
# 输出为:
Shape: (159, 6)
Columns: Index(['frame', 'point number', 'x', 'y', 'z', 'intensity'], dtype='object')
Head:frame  point number         x         y         z  intensity
0      0             0  1.507812 -0.339844  0.164062  22.174839
1      0             1  1.621094 -0.537109 -0.193359  27.379873

http://www.dtcms.com/a/319488.html

相关文章:

  • Flink-1.19.0-核心源码详解
  • 网站IP被劫持?三步自建防护盾
  • 【中微半导体】BAT32G139 逆变器,中微半导体pack包安装使用说明(参考例程获取DemoCode)
  • 51c大模型~合集165
  • 【动态规划 | 完全背包】动态规划经典应用:完全背包问题详解
  • 【CS创世SD NAND征文】额贴式睡眠监测仪的数据守护者:存储芯片如何实现7×24小时安眠状态下的全时稳定记录
  • Redis面试精讲 Day 13:Redis Cluster集群设计与原理
  • Flutter 三棵树
  • 数字取证:可以恢复手机上被覆盖的数据吗?
  • 【免费】小学数学算术专项突破随机生成加法减法乘法除法
  • 无人机计算机视觉数据集-7,000 张图片 空域安全监管 无人机反制系统 智能安防监控 交通执法应用 边境管控系统 赛事安保服务
  • 香港网站服务器被占用的资源怎么释放?
  • 《深入Java包装类体系:类型转换原理与Integer缓存实战指南》
  • 基于IPD流程体系的研发项目计划管理
  • Go 开发环境配置完整指南
  • 如何将普通HTTP API接口改造为MCP服务器
  • Numpy科学计算与数据分析:Numpy数组属性入门之形状、维度与大小
  • Node.js特训专栏-实战进阶:21.Nginx反向代理配置
  • Spring MVC文件上传详解
  • 使用 Tauri 开发 Android 应用:环境搭建与入门指南
  • Android 之 面试八股文
  • MySQL GROUP BY 语句详细说明
  • 什么是负载均衡,有哪些常见算法?
  • 计算机硬件组成原理
  • 复合机器人破局之路:如何逆袭突围
  • day 48 模型的可视化与推理
  • Spring Cloud 项目注册 Nacos 时设置真实 IP 的多种方式【多网卡/虚拟机实用指南】
  • 电子设计项目/复刻入门指南(从0到1的蜕变)--(持续更新...)(附完整项目举例)
  • 阿里云OSS vs 腾讯云COS深度对比:如何为网站静态资源选择最佳对象存储?
  • vue2+elementui select框可以选择可以回车添加新的option