当前位置: 首页 > news >正文

【Pandas】pandas DataFrame mode

Pandas2.2 DataFrame

Computations descriptive stats

方法描述
DataFrame.abs()用于返回 DataFrame 中每个元素的绝对值
DataFrame.all([axis, bool_only, skipna])用于判断 DataFrame 中是否所有元素在指定轴上都为 True
DataFrame.any(*[, axis, bool_only, skipna])用于判断 DataFrame 中是否至少有一个元素在指定轴上为 True
DataFrame.clip([lower, upper, axis, inplace])用于截断(限制)DataFrame 中的数值
DataFrame.corr([method, min_periods, …])用于计算 DataFrame 中各列之间的相关系数矩阵(Correlation Matrix)
DataFrame.corrwith(other[, axis, drop, …])用于计算当前 DataFrame 的每一列(或行)与另一个 Series 或 DataFrame 中对应列的相关系数
DataFrame.count([axis, numeric_only])用于统计 DataFrame 中每列或每行的非空(非 NaN)元素数量
DataFrame.cov([min_periods, ddof, numeric_only])用于计算 DataFrame 中每对列之间的协方差
DataFrame.cummax([axis, skipna])用于计算 DataFrame 中每列或每行的累计最大值(cumulative maximum)
DataFrame.cummin([axis, skipna])用于计算 DataFrame 中每列或每行的累计最小值(cumulative minimum)
DataFrame.cumprod([axis, skipna])用于计算 DataFrame 中每列或每行的累计乘积(cumulative product)
DataFrame.cumsum([axis, skipna])用于计算 DataFrame 中每列或每行的累计和(cumulative sum)
DataFrame.describe([percentiles, include, …])用于快速生成数据集的统计摘要(summary statistics)
DataFrame.diff([periods, axis])用于计算 DataFrame 中相邻行或列之间的差值(差分)
DataFrame.eval(expr, *[, inplace])用于在 DataFrame 上下文中高效地执行字符串形式的表达式运算
DataFrame.kurt([axis, skipna, numeric_only])用于计算 DataFrame 中每列或每行的峰度(Kurtosis)
DataFrame.kurtosis([axis, skipna, numeric_only])用于计算 DataFrame 中每列或每行的峰度(Kurtosis)
DataFrame.max([axis, skipna, numeric_only])用于计算 DataFrame 中每列或每行的最大值(maximum)
DataFrame.mean([axis, skipna, numeric_only])用于计算 DataFrame 中每列或每行的平均值(mean)
DataFrame.median([axis, skipna, numeric_only])用于计算 DataFrame 中每列或每行的中位数(median)
DataFrame.min([axis, skipna, numeric_only])用于计算 DataFrame 中每列或每行的最小值(minimum)
DataFrame.mode([axis, numeric_only, dropna])用于查找 众数(出现频率最高的值) 的方法

pandas.DataFrame.mode()

pandas.DataFrame.mode() 是 Pandas 中用于查找 众数(出现频率最高的值) 的方法。它返回一个 DataFrame,其中包含每列或每行的众数。

语法
DataFrame.mode(axis=0, numeric_only=False, dropna=True)
参数说明
参数类型默认值描述
axisint 或 str0定义计算方向:
- 0'index':按列计算众数
- 1'columns':按行计算众数
numeric_onlyboolFalse是否仅考虑数值类型(如 int、float),忽略字符串、对象等
dropnaboolTrue是否在计算前删除 NaN 值
返回值
  • 返回一个新的 DataFrame,每一列/行中包含该列/行的所有众数。
  • 如果某列有多个众数,则会以多行形式展示。

示例
示例数据:
import pandas as pddf = pd.DataFrame({'A': [1, 2, 2, 3, 3],'B': [4, 5, 5, 5, 6],'C': ['x', 'y', 'y', 'z', 'z']
})

输出原始数据:

   A  B  C
0  1  4  x
1  2  5  y
2  2  5  y
3  3  5  z
4  3  6  z

示例 1:默认参数(按列计算所有类型的众数)
df.mode()

结果:

   A  B  C
0  2  5  y
1  3  5  z

解释:

  • 列 A 的众数是 23(各出现两次)
  • 列 B 的众数是 5(出现三次)
  • 列 C 的众数是 yz(各出现两次)

示例 2:只考虑数值类型 (numeric_only=True)
df.mode(numeric_only=True)

结果:

   A  B
0  2  5
1  3  5

解释:

  • 忽略非数值列 C,只显示 AB 的众数

示例 3:按行计算众数 (axis=1)
df.mode(axis=1)

结果:

   0
0  1
1  2
2  2
3  3
4  3

解释:

  • 每一行的众数(这里每行只有一个众数)

注意事项
  • 若某列/行没有重复值,将返回空值或原始数据中第一个值。
  • 支持处理 NaN 值(通过 dropna 控制是否排除)。
  • 当存在多个众数时,会全部列出(作为多行)。

相关文章:

  • 《打造第二大脑》
  • 代购商城系统可以解决哪些重点难题?
  • FastAPI自定义异常处理:优雅转换Pydantic校验错误
  • java+selenium专题->启动浏览器下篇
  • 百胜ECOVADIS认证咨询公司,ecovadis评分提升攻略
  • 凸优化理论-进阶方法
  • Vue.js教学第六章:Vue 开发的高效路径,组件化基础
  • AI自动化工作流:开启当下智能生产力的价值
  • 2025 BYUCTF re 部分wp
  • 嵌入式学习笔记 D22:栈与队列
  • 板凳-------Mysql cookbook学习 (四)
  • GPU硬件计数器深度用法:通过NVIDIA Nsight Compute定位隐藏的性能瓶颈——以DRAM访问模式对带宽利用率影响分析为例
  • 第2篇 水滴穿透:IGBT模块的绝对防御体系
  • Python数据可视化初探——“十八般兵器”介绍
  • 嵌入式系统中,检测链路层(物理层)状态变化时,选择中断驱动还是定时轮询
  • 【每天一个知识点】embedding与representation
  • 为什么上传大量大文件推荐是使用 app 应用为不是 web 浏览器下载上传呢?
  • PLC组网的方法、要点及实施全解析
  • 网络传输(ping命令,wget命令,curl命令),端口
  • 代码随想录算法训练营第四十四天
  • 沧州盐碱地“逆天改命”:无用之地变良田,候鸟翔集水草丰美
  • 特朗普:将于19日分别与普京和泽连斯基通话
  • 海外考古大家访谈|冈村秀典:礼制的形成与早期中国
  • 张汝伦:康德和种族主义
  • 杞支雅男评《1517》|放眼世界,立足德国
  • 中日东三省问题的源起——《1905年东三省事宜谈判笔记》解题