当前位置: 首页 > news >正文

pandas DataFrame数据分组

数据分组

需要使用:

groupby(需要分组的内容)[按什么分组] 得到的是一个对象
结合agg函数将聚合得到的结果作为一个新列
agg(['sum','mean']) 进行求和与平均值 []里的内容是固定的

代码:

# 引用 pandas
import pandas as pd
# 定义数据
data = {
    "员工":["张三","李四","王五","赵六","孙七","周八"],
    "部门":["HR","HR","技术","技术","销售","销售"],
    "工资":[5000,5200,8000,7500,6000,5800],
    "性别":["男","男","女","女","男","女"],
    "年龄":[18,30,40,43,60,89]
}
# 创建 DataFrame
df = pd.DataFrame(data)
print(df)
# 按部门、年龄 工资进行分组
grouped = df.groupby(['部门','年龄'])['工资'].agg(['sum'])
print(grouped)

结果:

  员工  部门    工资 性别  年龄
0  张三  HR  500018
1  李四  HR  520030
2  王五  技术  800040
3  赵六  技术  750043
4  孙七  销售  600060
5  周八  销售  580089
        sum
部门 年龄      
HR 18  5000
   30  5200
技术 40  8000
   43  7500
销售 60  6000
   89  5800
http://www.dtcms.com/a/46930.html

相关文章:

  • CCF-CSP认证 202104-1灰度直方图
  • 在python语言中,请详细介绍一下比较运算符中等于符号(==)的情况?
  • Python数据序列化技术:高效存储与传输的最佳实践
  • LLMs之Data之smallpond:smallpond(基于DuckDB和3FS的一个轻量级的数据处理框架)的简介、安装和使用方法、案例应用之详细攻略
  • AI公司如何在经济寒冬中“逆势求生”
  • C++ STL(五) 无序关联容器
  • 【Delphi】如何解决使用webView2时主界面置顶,而导致网页选择文件对话框被覆盖问题
  • 【定昌Linux系统】部署了java程序,设置开启启动
  • 【最大半连通子图——tarjan求最大连通分量,拓扑排序,树形DP】
  • 大数据学习(52)-MySQL数据库基本操作
  • E22-xxxT22D lora模块介绍
  • 请说明字符串中 string str = null string str = ““ string str = string.Empty 三者的区别
  • 电商平台项目需求文档(精简版)
  • 实用AI推荐
  • 机器学习数学通关指南
  • C++STL---<limits>
  • 【Linux网络-HTTP协议】HTTP基础概念+构建HTTP
  • MySQL中like模糊查询如何优化?
  • 2025AI 有哪些重要的发展趋势?
  • Centos7部署k8s(单master节点安装)
  • 协议-Airkiss
  • LINUX网络基础 - 初识网络,理解网络协议
  • 一、Redis 通用命令大全
  • SoapUI 结合 Postman 测试 WebService 协议
  • 一个py文件搞定mysql查询+Json转换+表数据提取+根据数据条件生成excel文件+打包运行一条龙
  • AI日记app
  • 前端文件分片上传深度解析:从原理到实践
  • leetcode日记(74)扰乱字符串
  • 记录一次跨库连表的坑
  • Java中用Map<String,Object>存储层次结构