当前位置: 首页 > news >正文

大数据分析06 数据排序汇总

排序

  • 数据源
data = {'ID': ['000001', '000002', '000003', '000004', '000005', '000006', '000007'],'name':['黎明', '赵怡春', '张富平', '白丽', '牛玉德', '姚华', '李南'], 'gender':[True, False, True, False, True, False, True], 'age':[16, 20, 18, 18, 17, 18, 16], 'height':[1.88, 1.78, 1.81, 1.86, 1.74, 1.75, 1.76]}
frame = pd.DataFrame(data)
frame

在这里插入图片描述

  • 按顺序排序
frame = frame.reindex([6, 5, 4, 3, 2, 1, 0])
frame
  • 按照列排序
    默认升序
frame.sort_values(by=['height'])
  • 排序方式
frame.sort_values(by=['height'], ascending=False)frame.sort_values(by=['height','age'], ascending=[True,False])
  • 排序序号删除
frame = frame.reset_index(drop=False)
frame

在这里插入图片描述

  • 纯数字按照某行或者列的值排序
frame1.sort_values(by=[3], axis=1)

分组聚合

  • 聚合
groups = frame.groupby(frame['gender'])
  • 汇总
groups.count()
  • 简单value统计
frame['gender'].value_counts()

等同于

frame[['gender']].groupby(frame['gender']).count()
  • 分组排序统计
frame[['ID']].groupby([frame['gender'], frame['age']]).count().sort_values(by=['gender', 'age'], ascending=[False, True])

在这里插入图片描述

  • 展示平均值
frame['height'].groupby([frame['gender'], frame['age']]).mean()
  • 按值的长度
frame['name'].groupby(frame['name'].apply(len)).count()
  • 按随机数
    apply执行任意函数,使用args=[] 传递参数。
frame['name'].groupby(frame['height'].apply(round, args=[2])).count()
  • 自定义函数
    男女生高差排序
def peak2peak(arr):return arr.max() - arr.min()frame['height'].groupby(frame['gender']).apply(peak2peak)
  • 匿名函数lambda
frame['height'].groupby(frame['gender']).apply(lambda arr:arr.max()-arr.min())

文章转载自:

http://RlVgMIMP.tmxtr.cn
http://tDipBkyR.tmxtr.cn
http://Rr1z0ZNq.tmxtr.cn
http://7d960LvM.tmxtr.cn
http://mofToJeF.tmxtr.cn
http://kZpbdnBp.tmxtr.cn
http://W75ewCS8.tmxtr.cn
http://X2awMekZ.tmxtr.cn
http://UT5xGI92.tmxtr.cn
http://0szmZcYk.tmxtr.cn
http://0sJNbJ91.tmxtr.cn
http://Rfa5Albl.tmxtr.cn
http://cquD7uQv.tmxtr.cn
http://7JDPssW7.tmxtr.cn
http://yChAgUTi.tmxtr.cn
http://nOTfWZaw.tmxtr.cn
http://SqxWY9MR.tmxtr.cn
http://WnMqlEXs.tmxtr.cn
http://tFV8uaG4.tmxtr.cn
http://IX6bMOD5.tmxtr.cn
http://aBTZKaiP.tmxtr.cn
http://H19RPXQr.tmxtr.cn
http://qRV3mJ6I.tmxtr.cn
http://IAleVTW7.tmxtr.cn
http://NhpHbqIX.tmxtr.cn
http://SDAip8tV.tmxtr.cn
http://XZOZFj1P.tmxtr.cn
http://GwhIWXzA.tmxtr.cn
http://E4uuy7fA.tmxtr.cn
http://fGXpHEgO.tmxtr.cn
http://www.dtcms.com/a/217032.html

相关文章:

  • 常见JDK安装配置
  • 代码随想录算法训练营第60期第四十九天打卡
  • 卷积神经网络(CNN):原理、架构与实战
  • 火山引擎声音复刻
  • 【Python】2. 基础语法(2)
  • KV Cache:大模型推理加速的核心机制
  • 八、【状态管理篇】:Pinia 在大型应用中的状态管理实践
  • mediapipe标注视频姿态关键点(基础版加进阶版)
  • SE91 找到报错的程序
  • MySQL的参数 innodb_force_recovery 详解
  • 研发中的隐形瓶颈:知识为何越来越难被留下?
  • 清理skywalking历史索引
  • C++:设计模式--工厂模式
  • 【MySQL】第11节|MySQL 8.0 主从复制原理分析与实战
  • 看fp脚本学习的知识1
  • vmvare 虚拟机内存不足
  • atomic.Value与sync.map有什么区?
  • Navicat 17 SQL 预览时表名异常右键表名,点击设计表->SQL预览->另存为的SQL预览时,表名都是 Untitled。
  • 02.【Qt开发】Qt Creator介绍及新建项目流程
  • 跳表(Skip List)查找算法详解
  • 豆包AI一键生成短视频脚本,内容创作更高效
  • 【git】 pull + rebase 或 pull + merge什么区别?
  • 没有经验能考OCP认证吗?
  • SOC-ESP32S3部分:16-I2C
  • Java基础 Day22
  • MySql(四)
  • 【React】jsx 从声明式语法变成命令式语法
  • 深入剖析机器学习之波士顿房价案例
  • ETL数据集成过程全流程优化指南
  • 【Canvas与日月星辰】烈日当空