当前位置: 首页 > news >正文

Pandas:数据分箱

import pandas as pd
df = pd.read_csv("D:\BaiduNetdiskDownload\data\employees.csv")
df.head()

数据链接:

https://download.csdn.net/download/qq_43494013/91334882?spm=1001.2014.3001.5503
df1 = df.head(10)[['employee_id','salary']]
df1

在这里插入图片描述

pd.cut(df1['salary'],bins = 2)

在这里插入图片描述
其中bins = n,分成n段区间、起始值、结束值是所有数据的最小值、最大值,其中value_counts()是每个区间元素的个数

pd.cut(df1.salary,bins = 2).value_counts()

在这里插入图片描述

自定义区间

pd.cut(df1['salary'],bins = [0,10000,20000,30000])
pd.cut(df1['salary'],bins = [0,10000,20000,30000]).value_counts()

在这里插入图片描述
在这里插入图片描述
添加标签

df1['收入范围'] = pd.cut(df1['salary'],bins = [0,10000,20000,30000],labels = ['低','中','高'])

在这里插入图片描述

平均分配
qcut实现

df1 = df[['employee_id','salary']].head(10)
df1
pd.qcut(df1['salary'],3)
pd.qcut(df1['salary'],3).value_counts()

在这里插入图片描述
在这里插入图片描述
对睡眠数据进行分箱处理

数据链接:

https://download.csdn.net/download/qq_43494013/91336841?spm=1001.2014.3001.5503
df = pd.read_csv("D:\BaiduNetdiskDownload\data\sleep.csv")
df1 = df.head(10)[["person_id",'sleep_quality']]
df1

在这里插入图片描述

df1['睡眠质量'] = pd.cut(df1['sleep_quality'],bins = 3)
df1

在这里插入图片描述

df1['睡眠质量'] = pd.cut(df1['sleep_quality'],bins = 3,labels = ['差','中','优'])
df1

在这里插入图片描述

http://www.dtcms.com/a/273554.html

相关文章:

  • 使用Python和AkShare轻松获取新闻联播文字稿:从数据获取到文本挖掘
  • 剑指offer——链表:从尾到头打印链表
  • 自用docker记录
  • 学习C++、QT---21(QT中QFile库的QFile读取文件、写入文件的讲解)
  • 部署 React + Vite + TypeScript 项目到阿里云 ECS
  • ARMv9架构
  • tcp/quic 的滑动窗口
  • 飞算 JavaAI 体验:重塑 Java 开发的智能新范式
  • Element Plus和Ant Design Vue深度对比分析与选型指南
  • WD0407 40V 7A 超级肖特基二极管,应用于开关汽车工业控制
  • 【字节跳动】数据挖掘面试题0015:100 亿个单词,找出出现频率最高的单词。要求几种方案
  • 20250711荣品RD-RK3588开发板在Android13下的开机自启动的配置步骤
  • React之旅-05 List Key
  • 进制转换原理与实现详解
  • cyvcf2 知识点详解
  • MYSQL C_API使用全解
  • 基于gitlab 构建CICD发布到K8S 平台
  • Java大厂面试实录:谢飞机的电商场景技术问答(Spring Cloud、MyBatis、Redis、Kafka、AI等)
  • 飞算Java AI:专为 Java 开发者打造的智能开发引擎
  • 后台管理系统-权限管理
  • 云、实时、时序数据库混合应用:医疗数据管理的革新与展望(下)
  • 从Markdown到PPT:用Python打造专业演示文稿转换器
  • 2025前端面试真题以及答案-不断整理中,问题来源于牛客真题
  • 面具贴纸美颜SDK如何集成进直播APP?技术细节与性能优化实战
  • 百度2026届校招开启,大规模发力AI的百度未来何在?
  • PPT处理控件Aspose.Slides教程:使用 C# 将 PPTX 转换为 EMF
  • 【Linux仓库】命令行参数与环境变量【进程·伍】
  • 语音对话秒译 + 视频悬浮字 + 相机即拍即译:ViiTor 如何破局跨语言场景?
  • Django快速入门搭建网站
  • Monorepo 与包管理工具:从幽灵依赖看 npm 与 pnpm 的架构差异