当前位置：首页 > news >正文

大数据分析06 数据排序汇总

news 2025/10/30 0:58:02

排序

数据源

data = {'ID': ['000001', '000002', '000003', '000004', '000005', '000006', '000007'],'name':['黎明', '赵怡春', '张富平', '白丽', '牛玉德', '姚华', '李南'], 'gender':[True, False, True, False, True, False, True], 'age':[16, 20, 18, 18, 17, 18, 16], 'height':[1.88, 1.78, 1.81, 1.86, 1.74, 1.75, 1.76]}
frame = pd.DataFrame(data)
frame

在这里插入图片描述

按顺序排序

frame = frame.reindex([6, 5, 4, 3, 2, 1, 0])
frame

按照列排序
默认升序

frame.sort_values(by=['height'])

排序方式

frame.sort_values(by=['height'], ascending=False)frame.sort_values(by=['height','age'], ascending=[True,False])

排序序号删除

frame = frame.reset_index(drop=False)
frame

在这里插入图片描述

纯数字按照某行或者列的值排序

frame1.sort_values(by=[3], axis=1)

分组聚合

聚合

groups = frame.groupby(frame['gender'])

汇总

groups.count()

简单value统计

frame['gender'].value_counts()

等同于

frame[['gender']].groupby(frame['gender']).count()

分组排序统计

frame[['ID']].groupby([frame['gender'], frame['age']]).count().sort_values(by=['gender', 'age'], ascending=[False, True])

在这里插入图片描述

展示平均值

frame['height'].groupby([frame['gender'], frame['age']]).mean()

按值的长度

frame['name'].groupby(frame['name'].apply(len)).count()

按随机数
apply执行任意函数，使用args=[] 传递参数。

frame['name'].groupby(frame['height'].apply(round, args=[2])).count()

自定义函数
男女生高差排序

def peak2peak(arr):return arr.max() - arr.min()frame['height'].groupby(frame['gender']).apply(peak2peak)

匿名函数lambda

frame['height'].groupby(frame['gender']).apply(lambda arr:arr.max()-arr.min())

查看全文

http://www.dtcms.com/a/217032.html

常见JDK安装配置

代码随想录算法训练营第60期第四十九天打卡

卷积神经网络（CNN）：原理、架构与实战

火山引擎声音复刻

【Python】2. 基础语法(2)

KV Cache：大模型推理加速的核心机制

八、【状态管理篇】：Pinia 在大型应用中的状态管理实践

mediapipe标注视频姿态关键点（基础版加进阶版）

SE91 找到报错的程序

MySQL的参数 innodb_force_recovery 详解

研发中的隐形瓶颈：知识为何越来越难被留下？

清理skywalking历史索引

C++：设计模式--工厂模式

【MySQL】第11节｜MySQL 8.0 主从复制原理分析与实战

看fp脚本学习的知识1

vmvare 虚拟机内存不足

atomic.Value与sync.map有什么区?

Navicat 17 SQL 预览时表名异常右键表名，点击设计表-＞SQL预览-＞另存为的SQL预览时，表名都是 Untitled。

02.【Qt开发】Qt Creator介绍及新建项目流程

跳表（Skip List）查找算法详解

豆包AI一键生成短视频脚本，内容创作更高效

【git】 pull + rebase 或 pull + merge什么区别？

没有经验能考OCP认证吗？

SOC-ESP32S3部分：16-I2C

Java基础 Day22

MySql（四）

【React】jsx 从声明式语法变成命令式语法

深入剖析机器学习之波士顿房价案例

ETL数据集成过程全流程优化指南

【Canvas与日月星辰】烈日当空

排序

分组聚合

相关文章：