Pandas 安装使用教程
一、Pandas 简介
Pandas 是基于 NumPy 的强大数据分析库,提供了高效的数据结构(如 Series 和 DataFrame)以及丰富的数据操作工具,广泛用于数据清洗、处理、分析和可视化。
二、安装 Pandas
2.1 使用 pip 安装(推荐)
pip install pandas
2.2 使用 Anaconda 安装(适合科学计算)
conda install pandas
2.3 验证安装
import pandas as pd
print(pd.__version__)
三、Pandas 核心数据结构
3.1 Series(序列)
import pandas as pds = pd.Series([1, 2, 3, 4])
print(s)
3.2 DataFrame(数据表)
data = {'Name': ['小明', '小红'], 'Age': [22, 23]}
df = pd.DataFrame(data)
print(df)
四、常见操作
4.1 读取与保存数据
df = pd.read_csv("data.csv") # 读取 CSV
df.to_csv("output.csv", index=False) # 保存为 CSVdf = pd.read_excel("data.xlsx") # 读取 Excel
df.to_excel("output.xlsx", index=False) # 保存为 Excel
4.2 查看数据
df.head() # 查看前 5 行
df.tail() # 查看后 5 行
df.shape # 行列数
df.info() # 数据概况
df.describe() # 数据统计
五、数据选择与筛选
df["Name"] # 选择一列
df[["Name", "Age"]] # 选择多列
df.iloc[0] # 按行索引
df.loc[0, "Name"] # 按标签定位
df[df["Age"] > 22] # 条件筛选
六、数据清洗与处理
df.dropna() # 删除缺失值
df.fillna(0) # 填充缺失值
df.rename(columns={"Name": "姓名"}) # 重命名列
df.sort_values("Age") # 排序
df["Age"].astype(int) # 类型转换
七、分组与聚合
df.groupby("Age").count()
df.groupby("Age")["Name"].agg(["count", "nunique"])
八、合并与拼接
pd.concat([df1, df2]) # 按行拼接
pd.merge(df1, df2, on="ID", how="inner") # 按列合并
九、常见问题
Q1: 安装失败 ModuleNotFoundError: No module named 'pandas'
?
请确认使用的是正确的 Python 环境或执行以下命令:
pip install pandas --upgrade
Q2: Excel 文件无法读取?
请安装依赖包:
pip install openpyxl
十、学习资源推荐
- Pandas 官方文档
- 菜鸟教程 Pandas
- DataCamp Pandas 教程
- 《利用 Python 进行数据分析》— Wes McKinney(Pandas 作者)
本文由“小奇Java面试”原创发布,转载请注明出处。
可以搜索【小奇JAVA面试】第一时间阅读,回复【资料】获取福利,回复【项目】获取项目源码,回复【简历模板】获取简历模板,回复【学习路线图】获取学习路线图。