当前位置: 首页 > news >正文

大数据分析06 数据排序汇总

排序

  • 数据源
data = {'ID': ['000001', '000002', '000003', '000004', '000005', '000006', '000007'],'name':['黎明', '赵怡春', '张富平', '白丽', '牛玉德', '姚华', '李南'], 'gender':[True, False, True, False, True, False, True], 'age':[16, 20, 18, 18, 17, 18, 16], 'height':[1.88, 1.78, 1.81, 1.86, 1.74, 1.75, 1.76]}
frame = pd.DataFrame(data)
frame

在这里插入图片描述

  • 按顺序排序
frame = frame.reindex([6, 5, 4, 3, 2, 1, 0])
frame
  • 按照列排序
    默认升序
frame.sort_values(by=['height'])
  • 排序方式
frame.sort_values(by=['height'], ascending=False)frame.sort_values(by=['height','age'], ascending=[True,False])
  • 排序序号删除
frame = frame.reset_index(drop=False)
frame

在这里插入图片描述

  • 纯数字按照某行或者列的值排序
frame1.sort_values(by=[3], axis=1)

分组聚合

  • 聚合
groups = frame.groupby(frame['gender'])
  • 汇总
groups.count()
  • 简单value统计
frame['gender'].value_counts()

等同于

frame[['gender']].groupby(frame['gender']).count()
  • 分组排序统计
frame[['ID']].groupby([frame['gender'], frame['age']]).count().sort_values(by=['gender', 'age'], ascending=[False, True])

在这里插入图片描述

  • 展示平均值
frame['height'].groupby([frame['gender'], frame['age']]).mean()
  • 按值的长度
frame['name'].groupby(frame['name'].apply(len)).count()
  • 按随机数
    apply执行任意函数,使用args=[] 传递参数。
frame['name'].groupby(frame['height'].apply(round, args=[2])).count()
  • 自定义函数
    男女生高差排序
def peak2peak(arr):return arr.max() - arr.min()frame['height'].groupby(frame['gender']).apply(peak2peak)
  • 匿名函数lambda
frame['height'].groupby(frame['gender']).apply(lambda arr:arr.max()-arr.min())

相关文章:

  • 常见JDK安装配置
  • 代码随想录算法训练营第60期第四十九天打卡
  • 卷积神经网络(CNN):原理、架构与实战
  • 火山引擎声音复刻
  • 【Python】2. 基础语法(2)
  • KV Cache:大模型推理加速的核心机制
  • 八、【状态管理篇】:Pinia 在大型应用中的状态管理实践
  • mediapipe标注视频姿态关键点(基础版加进阶版)
  • SE91 找到报错的程序
  • MySQL的参数 innodb_force_recovery 详解
  • 研发中的隐形瓶颈:知识为何越来越难被留下?
  • 清理skywalking历史索引
  • C++:设计模式--工厂模式
  • 【MySQL】第11节|MySQL 8.0 主从复制原理分析与实战
  • 看fp脚本学习的知识1
  • vmvare 虚拟机内存不足
  • atomic.Value与sync.map有什么区?
  • Navicat 17 SQL 预览时表名异常右键表名,点击设计表->SQL预览->另存为的SQL预览时,表名都是 Untitled。
  • 02.【Qt开发】Qt Creator介绍及新建项目流程
  • 跳表(Skip List)查找算法详解
  • 淘宝店铺装网站导航怎么做/西地那非片能延时多久
  • 网站加速cdn自己做/如何做好网络营销
  • 网站策划布局/如何建网站赚钱
  • 做外贸如何浏览国外网站/优化师助理
  • 云南省科技网站/河北百度seo点击软件
  • 网站建设创新能力痛点/google优化推广