当前位置: 首页 > news >正文

Pandas 安装使用教程

一、Pandas 简介

Pandas 是基于 NumPy 的强大数据分析库,提供了高效的数据结构(如 Series 和 DataFrame)以及丰富的数据操作工具,广泛用于数据清洗、处理、分析和可视化。


二、安装 Pandas

2.1 使用 pip 安装(推荐)

pip install pandas

2.2 使用 Anaconda 安装(适合科学计算)

conda install pandas

2.3 验证安装

import pandas as pd
print(pd.__version__)

三、Pandas 核心数据结构

3.1 Series(序列)

import pandas as pds = pd.Series([1, 2, 3, 4])
print(s)

3.2 DataFrame(数据表)

data = {'Name': ['小明', '小红'], 'Age': [22, 23]}
df = pd.DataFrame(data)
print(df)

四、常见操作

4.1 读取与保存数据

df = pd.read_csv("data.csv")            # 读取 CSV
df.to_csv("output.csv", index=False)    # 保存为 CSVdf = pd.read_excel("data.xlsx")         # 读取 Excel
df.to_excel("output.xlsx", index=False) # 保存为 Excel

4.2 查看数据

df.head()       # 查看前 5 行
df.tail()       # 查看后 5 行
df.shape        # 行列数
df.info()       # 数据概况
df.describe()   # 数据统计

五、数据选择与筛选

df["Name"]              # 选择一列
df[["Name", "Age"]]     # 选择多列
df.iloc[0]              # 按行索引
df.loc[0, "Name"]       # 按标签定位
df[df["Age"] > 22]      # 条件筛选

六、数据清洗与处理

df.dropna()                     # 删除缺失值
df.fillna(0)                    # 填充缺失值
df.rename(columns={"Name": "姓名"})  # 重命名列
df.sort_values("Age")          # 排序
df["Age"].astype(int)          # 类型转换

七、分组与聚合

df.groupby("Age").count()
df.groupby("Age")["Name"].agg(["count", "nunique"])

八、合并与拼接

pd.concat([df1, df2])                           # 按行拼接
pd.merge(df1, df2, on="ID", how="inner")        # 按列合并

九、常见问题

Q1: 安装失败 ModuleNotFoundError: No module named 'pandas'

请确认使用的是正确的 Python 环境或执行以下命令:

pip install pandas --upgrade

Q2: Excel 文件无法读取?

请安装依赖包:

pip install openpyxl

十、学习资源推荐

  • Pandas 官方文档
  • 菜鸟教程 Pandas
  • DataCamp Pandas 教程
  • 《利用 Python 进行数据分析》— Wes McKinney(Pandas 作者)

本文由“小奇Java面试”原创发布,转载请注明出处。

可以搜索【小奇JAVA面试】第一时间阅读,回复【资料】获取福利,回复【项目】获取项目源码,回复【简历模板】获取简历模板,回复【学习路线图】获取学习路线图。

在这里插入图片描述

http://www.dtcms.com/a/266123.html

相关文章:

  • 黑马python(二十四)
  • Java——初始guava(1)
  • win11设置任务栏为顶部
  • 「Java流程控制」循环综合应用
  • Redis大Key问题
  • 【PyCharm 2025.1.2配置debug】
  • React Tailwind css 大前端考试、问卷响应式模板
  • Robot---能打羽毛球的机器人
  • Linux: perf report数据对比,python
  • Java的SpringAI+Deepseek大模型实战之会话记忆
  • MySQL 8.0 OCP 1Z0-908 题目解析(19)
  • 基于SpringBoot+Vue的电影售票系统(协同过滤算法)
  • 【数据安全】连续数据突升检测
  • 优化Facebook广告投放的五大关键策略
  • 全双工和半双工在以太网报文收发过程中的核心区别
  • AMD-R9-9950X 和 微星B850M-MORTAR-WIFI主板 简单开箱测评
  • [自然语言处理]汉语文本分词
  • Odoo 中国特色高级工作流审批模块研发
  • 页面登录数据的加密(前端+后端)
  • 使用pdf box去水印
  • 搜索选择DFS还是BFS
  • NumPy-核心函数transpose()深度解析
  • 【HarmonyOS】HAR和HSP循环依赖和依赖传递问题详解
  • 二叉树展开为链表C++
  • 20.数据同步Mysql-ES解决方案
  • 网络编程学习路线图
  • 如何配置core dump生成
  • Android App冷启动流程详解
  • webrtc-streamer视频流播放(rstp协议h264笔记)
  • 新人如何入门学习 STM32?