当前位置: 首页 > news >正文

pandas方法集

pandas 方法全集(方法名 + 用途)

说明:本清单按主题与对象分区,采用「方法名:用途」的简要格式,覆盖 pandas 常用到中高级 API。若同名方法同时适用于 SeriesDataFrame,默认两者均支持(特别例外将注明)。

目录

mindmaproot((pandas 方法))顶层构造与核心对象IO 读写(pd 顶层)通用属性与基本方法(Series/DataFrame)数据选择与切片对齐与重建索引缺失值处理重塑与变形连接与合并分组与聚合(GroupBy/Resampler)统计与描述数学与元素级运算窗口计算(Rolling/Expanding/EWM)字符串处理(Series.str)日期时间访问器(Series.dt)分类数据(Series.cat)时间序列与频率索引对象(Index/RangeIndex/MultiIndex/DatetimeIndex)DataFrame 结构操作(列/行)排序与排名去重与对齐应用与自定义函数可视化与样式稀疏与扩展类型选项与显示(pd)错误检查与类型判断高级主题与其他常见构造辅助(pd)已弃用 / 注意事项

1. 顶层构造与核心对象

  • pd.Series:一维带标签数组
  • pd.DataFrame:二维表格数据结构
  • pd.Index / pd.MultiIndex:索引 / 多级索引
  • pd.Categorical:分类数据标量 / 数组
  • pd.Interval / pd.IntervalIndex:区间与区间索引
  • pd.Timestamp / pd.Timedelta / pd.Period:时间戳 / 时间差 / 时期
  • pd.array:创建扩展数组
  • pd.CategoricalDtype / pd.ArrowDtype:分类 / Arrow 扩展 dtype

2. IO 读写(pd 顶层)

  • read_csv / to_csv:CSV 读写
  • read_table:分隔文本读取
  • read_excel / to_excel:Excel 读写
  • read_json / to_json:JSON 读写
  • read_parquet / to_parquet:Parquet 读写
  • read_feather / to_feather:Feather 读写
  • read_orc / to_orc:ORC 读写
  • read_sas:SAS 文件读取
  • read_stata / to_stata:Stata 读写
  • read_spss:SPSS 读取
  • read_pickle / to_pickle:pickle 读写
  • read_hdf / to_hdf:HDF5 读写
  • read_sql / read_sql_query / read_sql_table / to_sql:SQL 读写
  • read_html:HTML 表格读取
  • read_clipboard / to_clipboard:剪贴板读写

3. 通用属性与基本方法(Series/DataFrame)

  • shape / ndim / size:维度 / 轴数 / 元素数
  • dtypes / astype:数据类型查看 / 转换
  • index / columns(DF)/ name(Series)/ rename:索引与命名
  • set_axis / set_index / reset_index:设置轴 / 设置索引 / 重置索引
  • copy:拷贝
  • head / tail:前 N / 后 N 行
  • sample:随机抽样
  • memory_usage:内存占用
  • info(DF):结构与内存信息
  • select_dtypes(DF):按 dtype 选列
  • pipe:函数式管道
  • convert_dtypes:推断更合理的可空 dtype

4. 数据选择与切片

  • []:按列名(DF)/ 位置(Series)/ 布尔筛选
  • loc:标签索引
  • iloc:位置索引
  • at / iat:标量快速取 / 设
  • get:安全获取列(DF)或键(Series)
  • filter:按标签模式筛选

5. 对齐与重建索引

  • reindex / reindex_like:按新索引 / 模板重建
  • sort_index / sort_values:按索引 / 值排序
  • rename_axis:重命名轴
  • swaplevel / reorder_levels(MI):层级交换 / 重排
  • droplevel(MI):删除层级

6. 缺失值处理

  • isna / isnull / notna / notnull:缺失检测
  • dropna:删除缺失
  • fillna:填充缺失
  • interpolate:插值填补
  • ffill / bfill:向前 / 向后填充(fillna(method=...)

7. 重塑与变形

  • pivot / pivot_table:透视表
  • melt:列转行(反透视)
  • stack / unstack:层级堆叠 / 展开
  • wide_to_long:宽表转长表
  • explode:列表列爆炸为多行
  • get_dummies:类别独热编码
  • crosstab(pd):列联表

8. 连接与合并

  • merge:按键合并(SQL 风格)
  • merge_asof:按顺序近邻连接(时间序列常用)
  • concat:按轴拼接
  • join(DF):索引连接
  • append(已弃用):请改用 concat

9. 分组与聚合(GroupBy/Resampler)

  • groupby:分组
  • agg / aggregate:聚合
  • transform:组内变换并对齐原形状
  • filter:按组过滤
  • 常用聚合:sum / mean / median / min / max / count / size / std / var / sem / prod / nth / first / last
  • resample:按时间频率重采样
  • ngroup / cumcount:组编号 / 组内累计计数
  • rank:排名

10. 统计与描述

  • describe:描述统计
  • value_counts:去重计数
  • unique / nunique:唯一值 / 数量
  • quantile:分位数
  • corr / cov:相关 / 协方差
  • skew / kurt:偏度 / 峰度
  • idxmin / idxmax:最小 / 最大值位置
  • clip:裁剪到区间
  • abs / round:绝对值 / 四舍五入
  • cummax / cummin / cumsum / cumprod:累计统计
  • diff / pct_change:差分 / 环比

11. 数学与元素级运算

  • add / sub / mul / div / pow:对齐算术
  • radd / rsub 等:反向算术
  • floordiv / mod:整除 / 取模
  • where / mask:条件替换
  • compare(DF):逐元素比较
  • eq / ne / gt / ge / lt / le:比较运算

12. 窗口计算(Rolling/Expanding/EWM)

  • rolling:滑动窗口
  • expanding:扩张窗口
  • ewm:指数加权窗口
  • 窗口方法:mean / sum / std / var / min / max / median / quantile / corr / cov / apply

13. 字符串处理(Series.str)

  • str.lower / upper / title / strip:大小写 / 去空白
  • str.contains / match / fullmatch:模式匹配
  • str.replace:替换(可正则)
  • str.extract / extractall:正则提取
  • str.split / rsplit / partition:分割
  • str.get / slice / slice_replace:切片 / 替换
  • str.len:长度
  • str.pad / zfill / ljust / rjust:填充对齐
  • str.find / rfind / startswith / endswith:查找匹配
  • str.cat:字符串拼接
  • str.encode / decode:编解码
  • str.wrap:换行
  • str.normalize:Unicode 规范化

14. 日期时间访问器(Series.dt)

  • dt.year / month / day / hour / minute / second:时间字段
  • dt.week(旧)/ isocalendar / dayofweek / day_name:周相关
  • dt.date / time / tz:日期 / 时间 / 时区
  • dt.to_period / to_pydatetime / tz_localize / tz_convert:时期 / 转换 / 时区
  • dt.floor / ceil / round:对齐到频率
  • dt.normalize:归一化为午夜
  • dt.days / seconds / components:timedelta 组件

15. 分类数据(Series.cat)

  • cat.set_categories / reorder_categories:设置 / 重排类别
  • cat.add_categories / remove_categories:增删类别
  • cat.rename_categories:重命名类别
  • cat.as_ordered / as_unordered:有序 / 无序
  • cat.codes:类别编码

16. 时间序列与频率

  • to_datetime / to_timedelta / to_period(pd):类型转换
  • date_range / period_range / bdate_range:生成时间索引
  • 偏移对象:如 offsets.BDayMonthEnd
  • resample:按频率重采样(聚合)
  • asfreq:改变频率(不聚合)
  • shift:位移
  • 时间窗口滚动:rolling('7D')

17. 索引对象(Index/RangeIndex/MultiIndex/DatetimeIndex)

  • take / putmask:按位置取 / 按掩码放
  • 集合运算:union / intersection / difference / symmetric_difference
  • isin:成员检测
  • get_loc / slice_indexer:定位器
  • duplicated / drop_duplicates:去重
  • sort_values / sortlevel(MI):排序
  • set_names / rename:命名
  • 构造 MI:from_product / from_arrays / from_tuples

18. DataFrame 结构操作(列/行)

  • assign:新增或变换列
  • insert:按位置插入列
  • drop:删除行 / 列
  • pop:弹出列
  • update:用另一对象的非缺失更新
  • 重排列:reindex(columns=...)
  • T:转置
  • set_flags / flags:行为标志(如只读)

19. 排序与排名

  • sort_values:按列或 Series 排序
  • sort_index:按索引排序
  • nlargest / nsmallest:取前 K 大 / 小
  • rank:排名(多种平级策略)

20. 去重与对齐

  • drop_duplicates / duplicated:去重 / 标识重复
  • equals:结构与值完全相等
  • combine_first:用另一对象非缺失补全
  • align:对齐到共同索引 / 列

21. 应用与自定义函数

  • apply:按轴应用函数
  • applymap(DF):逐元素应用
  • map(Series):映射
  • aggregate / agg:聚合(函数或字典)
  • transform:形状不变的组 / 列转换
  • eval / query:表达式求值 / 查询(字符串 DSL)

22. 可视化与样式

  • plot / plot.line / bar / barh / hist / box / kde

文章转载自:

http://HVYATyWl.wqfrd.cn
http://E1DczdIu.wqfrd.cn
http://wfuR3ZYp.wqfrd.cn
http://4oH5xeCn.wqfrd.cn
http://iXCb00Rp.wqfrd.cn
http://wvOyrFQR.wqfrd.cn
http://ArdOooED.wqfrd.cn
http://fnpW9Uzc.wqfrd.cn
http://0nqim3qI.wqfrd.cn
http://s7twQLTp.wqfrd.cn
http://N7i5o0el.wqfrd.cn
http://C0AyTcPp.wqfrd.cn
http://2GBpSxc2.wqfrd.cn
http://L11zUdBv.wqfrd.cn
http://FS5wiL7O.wqfrd.cn
http://OXa45nCZ.wqfrd.cn
http://RpnOj9tA.wqfrd.cn
http://uwZwc5Pb.wqfrd.cn
http://Zu3724PO.wqfrd.cn
http://HvoaZ5IW.wqfrd.cn
http://l0wY5LTz.wqfrd.cn
http://QaLd3lKd.wqfrd.cn
http://oorVE1V5.wqfrd.cn
http://7iw2QSc9.wqfrd.cn
http://O5XPP3VY.wqfrd.cn
http://EEtXZC6V.wqfrd.cn
http://6i92sMOD.wqfrd.cn
http://mRTj4f4M.wqfrd.cn
http://7OHK6xx2.wqfrd.cn
http://b4Jynr2b.wqfrd.cn
http://www.dtcms.com/a/386936.html

相关文章:

  • PAT乙级_1106 2019数列_Python_AC解法_含疑难点
  • 自动检测并交互删除未使用 Docker 自定义网桥
  • 物联网卡相关知识
  • 访答编辑器使用体验
  • 日常系统问题解决:数据库查询停止
  • 5.3 文件系统 (答案见原书)
  • 【C++】C++11(一)
  • 两数的乘积 = 最大公约数 × 最小公倍数
  • 【Block总结】FDConv,多频动态调制卷积模块|即插即用|CVPR2025
  • Python 爬虫入门:如何抓取电商网站商品数据
  • 2025年上半年软考系统架构设计师备考指南
  • 双反向传播训练光子神经网络(未做完)
  • Java和rust的AES加解密算法互相转化,秘钥key格式不一致带来的问题
  • Altium Designer(AD24)导入DDB库文件(Protel 99SE)方法
  • GEO数据集编号,我为您整理了对应的芯片平台信息的获得办法
  • 《漫威争锋》新内容曝光:刀锋战士预热登场及多项更新
  • 【Redis】-- 哨兵
  • C++八大排序
  • 特殊文件,日志
  • Linux命令大全(文件管理)
  • jira工具
  • 易语言制表符替换为空格如何替换?
  • 2020考研数学(二)真题
  • JVM-对象内存布局
  • leetcode 5 最长回文子串
  • [笔记] 系统分析师 第十二章 软件架构设计(分析师主要工作)
  • 健康大数据管理与服务专业发展潜力大吗?
  • 六、Scala特质
  • 在LazyVim中配置Rust开发环境
  • Navicat x 金仓 KingbaseES 快速入门指南