当前位置：首页 > news >正文

pandas方法集

news 2025/9/17 11:55:59

pandas 方法全集（方法名 + 用途）

说明：本清单按主题与对象分区，采用「方法名：用途」的简要格式，覆盖 pandas 常用到中高级 API。若同名方法同时适用于 Series 与 DataFrame，默认两者均支持（特别例外将注明）。

mindmaproot((pandas 方法))顶层构造与核心对象IO 读写（pd 顶层）通用属性与基本方法（Series/DataFrame）数据选择与切片对齐与重建索引缺失值处理重塑与变形连接与合并分组与聚合（GroupBy/Resampler）统计与描述数学与元素级运算窗口计算（Rolling/Expanding/EWM）字符串处理（Series.str）日期时间访问器（Series.dt）分类数据（Series.cat）时间序列与频率索引对象（Index/RangeIndex/MultiIndex/DatetimeIndex）DataFrame 结构操作（列/行）排序与排名去重与对齐应用与自定义函数可视化与样式稀疏与扩展类型选项与显示（pd）错误检查与类型判断高级主题与其他常见构造辅助（pd）已弃用 / 注意事项

1. 顶层构造与核心对象

pd.Series：一维带标签数组
pd.DataFrame：二维表格数据结构
pd.Index / pd.MultiIndex：索引 / 多级索引
pd.Categorical：分类数据标量 / 数组
pd.Interval / pd.IntervalIndex：区间与区间索引
pd.Timestamp / pd.Timedelta / pd.Period：时间戳 / 时间差 / 时期
pd.array：创建扩展数组
pd.CategoricalDtype / pd.ArrowDtype：分类 / Arrow 扩展 dtype

2. IO 读写（pd 顶层）

read_csv / to_csv：CSV 读写
read_table：分隔文本读取
read_excel / to_excel：Excel 读写
read_json / to_json：JSON 读写
read_parquet / to_parquet：Parquet 读写
read_feather / to_feather：Feather 读写
read_orc / to_orc：ORC 读写
read_sas：SAS 文件读取
read_stata / to_stata：Stata 读写
read_spss：SPSS 读取
read_pickle / to_pickle：pickle 读写
read_hdf / to_hdf：HDF5 读写
read_sql / read_sql_query / read_sql_table / to_sql：SQL 读写
read_html：HTML 表格读取
read_clipboard / to_clipboard：剪贴板读写

3. 通用属性与基本方法（Series/DataFrame）

shape / ndim / size：维度 / 轴数 / 元素数
dtypes / astype：数据类型查看 / 转换
index / columns（DF）/ name（Series）/ rename：索引与命名
set_axis / set_index / reset_index：设置轴 / 设置索引 / 重置索引
copy：拷贝
head / tail：前 N / 后 N 行
sample：随机抽样
memory_usage：内存占用
info（DF）：结构与内存信息
select_dtypes（DF）：按 dtype 选列
pipe：函数式管道
convert_dtypes：推断更合理的可空 dtype

4. 数据选择与切片

[]：按列名（DF）/ 位置（Series）/ 布尔筛选
loc：标签索引
iloc：位置索引
at / iat：标量快速取 / 设
get：安全获取列（DF）或键（Series）
filter：按标签模式筛选

5. 对齐与重建索引

reindex / reindex_like：按新索引 / 模板重建
sort_index / sort_values：按索引 / 值排序
rename_axis：重命名轴
swaplevel / reorder_levels（MI）：层级交换 / 重排
droplevel（MI）：删除层级

6. 缺失值处理

isna / isnull / notna / notnull：缺失检测
dropna：删除缺失
fillna：填充缺失
interpolate：插值填补
ffill / bfill：向前 / 向后填充（fillna(method=...)）

7. 重塑与变形

pivot / pivot_table：透视表
melt：列转行（反透视）
stack / unstack：层级堆叠 / 展开
wide_to_long：宽表转长表
explode：列表列爆炸为多行
get_dummies：类别独热编码
crosstab（pd）：列联表

8. 连接与合并

merge：按键合并（SQL 风格）
merge_asof：按顺序近邻连接（时间序列常用）
concat：按轴拼接
join（DF）：索引连接
append（已弃用）：请改用 concat

9. 分组与聚合（GroupBy/Resampler）

groupby：分组
agg / aggregate：聚合
transform：组内变换并对齐原形状
filter：按组过滤
常用聚合：sum / mean / median / min / max / count / size / std / var / sem / prod / nth / first / last
resample：按时间频率重采样
ngroup / cumcount：组编号 / 组内累计计数
rank：排名