当前位置: 首页 > news >正文

【61 Pandas+Pyecharts | 基于Apriori算法及帕累托算法的超市销售数据分析可视化】

文章目录

  • 🏳️‍🌈 1. 导入模块
  • 🏳️‍🌈 2. Pandas数据处理
    • 2.1 读取数据
    • 2.2 数据信息
    • 2.3 数据去重
    • 2.4 订单日期处理提取年份
    • 2.5 产品名称处理
  • 🏳️‍🌈 3. Pyecharts数据可视化
    • 3.1 每年销售额和利润分布
    • 3.2 各地区销售额和利润分布
    • 3.3 各省订单量分布
    • 3.4 各省销售额分布
    • 3.5 各类别产品订单量
    • 3.6 客户类别占比
    • 3.7 Apriori算法关联分析
    • 3.8 帕累托分析
  • 🏳️‍🌈 4. 可视化项目源码+数据

大家好,我是 👉 【Python当打之年(点击跳转)】

本期我们利用Python分析「超市销售数据集」,看看:每年销售额和利润分布、各地区销售额和利润分布、各省订单量分布、各省销售额分布、各类别产品订单量、客户类别占比等等,希望对大家有所帮助,如有疑问或者需要改进的地方可以联系小编。

涉及到的库:

  • Pandas— 数据处理
  • Pyecharts— 数据可视化

🏳️‍🌈 1. 导入模块

import pandas as pd
from pyecharts.charts import *
from pyecharts import options as opts
import warnings
warnings.filterwarnings('ignore')

🏳️‍🌈 2. Pandas数据处理

2.1 读取数据

df = pd.read_excel('超市销售数据.xlsx')

在这里插入图片描述

2.2 数据信息

df.info()

在这里插入图片描述

2.3 数据去重

df = df.drop_duplicates()

2.4 订单日期处理提取年份

df['年'] = df['订单日期'].dt.year

2.5 产品名称处理

在这里插入图片描述

🏳️‍🌈 3. Pyecharts数据可视化

3.1 每年销售额和利润分布

defget_chart1():chart = (Bar().add_xaxis(x_data).add_yaxis('销售额', y_data1,gap='5%',label_opts=opts.LabelOpts(formatter='{c}万')).add_yaxis('利润', y_data2,gap='5%',label_opts=opts.LabelOpts(formatter='{c}万')).set_global_opts(title_opts=opts.TitleOpts(title='1-每年销售额和利润分布',subtitle=subtitle,pos_top='2%',pos_left='center'),legend_opts=opts.LegendOpts(pos_top='15%')))

在这里插入图片描述

  • 销售额和利润均呈现逐年增长的趋势。

3.2 各地区销售额和利润分布

在这里插入图片描述

  • 华东大区的销售额最高,反映出当地消费能力较高,中南和东北地区紧随其后,利润方面来看,中南地区和华东地区的利润要远高于其他地区。

3.3 各省订单量分布

在这里插入图片描述

  • 沿海地区的订单量要明显高于内地,尤其是广东、山东、江苏、辽宁。

3.4 各省销售额分布

在这里插入图片描述

3.5 各类别产品订单量

在这里插入图片描述

  • 办公用品类商品需求量最大,占比超过了50%,技术类和家具类各占20%左右。

3.6 客户类别占比

在这里插入图片描述

  • 客户类别以个体消费者为主,其次是公司和小型企业。

3.7 Apriori算法关联分析

# 转换为算法可接受模型(布尔值)
te = TransactionEncoder()
d_data = te.fit(data_am).transform(data_am)
df_t = pd.DataFrame(d_data,columns=te.columns_)
# 设置支持度求频繁项集
frequent_itemsets = apriori(df_t,min_support=0.04,use_colnames= True)
rules = association_rules(frequent_itemsets,metric = 'confidence',min_threshold = 0.1)
# 设置最小提升度, 一般认为提升度大于1的关联规则才有商业价值
rules = rules.drop(rules[rules.lift <1].index)
# 设置标题索引并打印结果
rules.rename(columns = {'antecedents':'from','consequents':'to','support':'sup','confidence':'conf'},inplace = True)
rules = rules[['from','to','sup','conf','lift']].sort_values('sup',ascending=False).reset_index(drop=True)

结果:
在这里插入图片描述

在这里插入图片描述

3.8 帕累托分析

帕累托分析模型(Pareto Analysis),又称80/20法则、ABC分析法或主次因素分析法,是一种基于“关键少数与次要多数”原理的决策工具,用于识别和优先处理对结果影响最大的关键因素。

defget_chart8():bar = (Bar().add_xaxis(x_data).add_yaxis("销售额", y_data1,itemstyle_opts=opts.ItemStyleOpts(color=range_color[-1]),label_opts=opts.LabelOpts(is_show=False),).extend_axis(yaxis=opts.AxisOpts(max_=120,)).set_global_opts(title_opts=opts.TitleOpts(title='8-帕累托分析',subtitle=subtitle,pos_top='2%',pos_left='center',),xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=60,font_size=10)),legend_opts=opts.LegendOpts(pos_top='12%')))line = (Line().add_xaxis(x_data).add_yaxis("累积利润占比",y_data2,z=10,yaxis_index=1,label_opts=opts.LabelOpts(is_show=False),))

在这里插入图片描述

🏳️‍🌈 4. 可视化项目源码+数据

点击跳转:【全部可视化项目源码+数据】


以上就是本期为大家整理的全部内容了,赶快练习起来吧,原创不易,喜欢的朋友可以点赞、收藏也可以分享注明出处)让更多人知道。


文章转载自:

http://ookI2Hwq.ykshx.cn
http://lLTvceAe.ykshx.cn
http://PTezmKKX.ykshx.cn
http://N7VVCgHK.ykshx.cn
http://ydie4baa.ykshx.cn
http://ulNiLgTs.ykshx.cn
http://MsqYe6uv.ykshx.cn
http://eC5PHlHR.ykshx.cn
http://YN3vzMBy.ykshx.cn
http://oCBjiRcl.ykshx.cn
http://FvtdI5SR.ykshx.cn
http://yI5O2P8H.ykshx.cn
http://7XKbchBs.ykshx.cn
http://TQ0fOQv0.ykshx.cn
http://7rrMpnfR.ykshx.cn
http://RZIrgocr.ykshx.cn
http://Z3eKGyFp.ykshx.cn
http://XvjVslIS.ykshx.cn
http://QmtxCE1d.ykshx.cn
http://LZdDllKy.ykshx.cn
http://EcuI2UMS.ykshx.cn
http://CjIkMaUp.ykshx.cn
http://w13xsyH1.ykshx.cn
http://IJEplG3o.ykshx.cn
http://1ccxPPEN.ykshx.cn
http://vas8pj7q.ykshx.cn
http://9AoHbWV3.ykshx.cn
http://9IM1mLdR.ykshx.cn
http://sgCQJ8FY.ykshx.cn
http://2VoA6rOx.ykshx.cn
http://www.dtcms.com/a/247629.html

相关文章:

  • CIM和建筑风貌管控平台
  • 【QSoundEffect QT 音频文件的播放】
  • 第10章 语句 笔记 待完善
  • echarts在折线图与0刻度线交汇处 添加markPoint
  • 【车机显示仪表】软硬件详细方案
  • Mini DeepSeek-v3训练脚本学习
  • 【k8s】阿里云ACK服务中GPU实例部署问题
  • AutoGLM沉思版:智能体推理的Deep Research探索
  • python从环境变量和配置文件中获取配置参数
  • 【面板数据】A股上市公司注册地所在地数据集(1991-2023年)
  • 【免费分享】GWO-BP-AdaBoost预测!灰狼优化、人工神经网络与AdaBoost集成学习算法预测研究
  • 梨泛转录组-文献精读145
  • 基于MATLAB的车牌检测系统:传统图像处理与深度学习的创新融合
  • 使用GpuGeek训练图像分类器:从入门到精通
  • Python实现下载监控工具:自动检测并移动下载文件
  • 计算机视觉与深度学习 | 低照度图像增强算法综述(开源链接,原理,公式,代码)
  • Day53 Python打卡训练营
  • Python Day50
  • 04 - CoordAttention模块
  • Python图片格式转换工具深度解析[附源码】
  • 完整强化学习教程:基于4x4网格世界的智能体探索之旅(一)
  • 2025-06-13【视频处理】基于视频内容转场进行分割
  • 动态规划算法的欢乐密码(二):路径问题
  • Spring Cloud Gateway + JWT 单点登录实现方案(无独立的认证服务器)
  • 最新 Python-PLAXIS 自动化建模技术与典型岩土工程案例实践应用
  • 搭建网站应该怎样选择服务器?
  • 轻量级密码算法LED的C语言实现(无第三方库)
  • 造成服务器宕机的原因都有哪些?
  • SpringBoot 服务器监控 监控系统开销 获取服务器系统的信息用户信息 运行信息 保持稳定
  • JVM 内存、JMM内存与集群机器节点内存的联系