当前位置: 首页 > news >正文

python pyecharts 数据分析及可视化

一、任务要求:

任务一:药品消费趋势分析
【任务说明】
现有某医疗机构 10 年的药品销售数据,请根据任务要求完成数
据分析。
【任务要求】
读取所需数据集后对数据进行必要的清洗,分析中成药和西药在
这 10 年中销售占比以及销售额的变化情况,绘制出堆叠面积图并用
Django 框架渲染到前端页面,绘图要求如下:
1.使用 PyEcharts 库绘制堆叠面积图;
2.使用 Django 框架在前端页面中渲染展示堆叠面积图;

二、代码部分:

import pandas as pd
import pyecharts.options as opts
from pyecharts.charts import Line# 读取数据
data_mpv_sale = pd.read_excel(r'./MPV销量数据2012-2021(1).xlsx')# 去重和排序
data_mpv_sale2 = data_mpv_sale.drop_duplicates(subset=['采集时间', '排名'], keep='last')
data_mpv_sale2 = data_mpv_sale2.sort_values(by=['采集时间', '排名'])
print(f"")
print(f"data_mpv_sale2:\n{data_mpv_sale2}")# 转换采集时间为日期格式,便于比较
data_mpv_sale2['采集时间'] = pd.to_datetime(data_mpv_sale2['采集时间'], format='%Y%m')# # 过滤2017年之后的数据
# data_mpv_sale3 = data_mpv_sale2[data_mpv_sale2['采集时间'] > '2017-01-01']
data_mpv_sale3 = data_mpv_sale2# 新增车型_厂商列
data_mpv_sale3['车型_厂商'] = data_mpv_sale3['车型'] + '_' + data_mpv_sale3['厂商']# 创建年份和月份列
data_mpv_sale3['年份'] = data_mpv_sale3['采集时间'].dt.year
data_mpv_sale3['月份'] = data_mpv_sale3['采集时间'].dt.month
print(f"data_mpv_sale3:\n{data_mpv_sale3}")# 定义季度函数
def jidu(month):
"""根据月份返回季度"""
if month <= 3:
return 1
elif month <= 6:
return 2
elif month <= 9:
return 3
else:
return 4# 应用季度函数
data_mpv_sale3['季度'] = data_mpv_sale3['月份'].apply(jidu)# 新增年份_季度列
data_mpv_sale3['年份_季度'] = data_mpv_sale3['年份'].astype(str) + '年' + data_mpv_sale3['季度'].astype(str) + '季度'# 汇总销量数据
sale_season = data_mpv_sale3.groupby(by=['车型_厂商', '年份_季度'])['销量'].sum()# 获取销量前20的车型
sale_total20 = data_mpv_sale3.groupby(by=['车型_厂商'])['销量'].sum().sort_values(ascending=False)[:20].index.valuesprint(f"sale_total20:\n{sale_total20}")# 定义时间列表
year = [2017, 2018, 2019, 2020, 2021]
season = [1, 2, 3, 4]
list_time = [f'{y}年{s}季度' for y in year for s in season if not (y == 2021 and s >= 3)]
print(f"list_time:\n{list_time}")# 创建字典存储销量
sale_dict = {}
for c in sale_total20:
sale_dict[c] = [int(sale_season.get((c, t), 0)) for t in list_time]
print(f"sale_dict:\n{sale_dict}")# 创建折线图
c = (
Line(init_opts=opts.InitOpts(width='800px', height='400px'))
.add_xaxis(xaxis_data=list_time)
.set_global_opts(
tooltip_opts=opts.TooltipOpts(trigger="axis", axis_pointer_type="cross"),
yaxis_opts=opts.AxisOpts(type_="value", axistick_opts=opts.AxisTickOpts(is_show=True),
splitline_opts=opts.SplitLineOpts(is_show=True)),
xaxis_opts=opts.AxisOpts(type_="category", boundary_gap=False),
datazoom_opts=opts.DataZoomOpts(),
)
)# 绘制销量曲线
for name, sale_list in sale_dict.items():
c.add_yaxis(
series_name=name,
stack="总量", # 堆积
y_axis=sale_list,
areastyle_opts=opts.AreaStyleOpts(opacity=0.5),
label_opts=opts.LabelOpts(is_show=False), # 隐藏数据标签
is_smooth=True, # 平滑曲线
)# 渲染图表
c.render_notebook() # 如果在Jupyter中运行
# 或者
c.render('mpv_sales_trend.html') # 保存为HTML文件

三、运行结果:

相关文章:

  • 微信小程序<rich-text>支持里面图片点击放大
  • [自动驾驶-深度学习] PPliteSeg—基础部署(TensorRT)
  • Nordic nRF54L15 SoC对包含电池监测、中断处理和电源轨控制的定制 nPM1300 示例
  • GC 学习笔记
  • 数据分享:健康与体能监测数据
  • 鸿蒙分布式数据管理:构建无缝跨设备体验的核心技术
  • WebRTC(十):RTP和SRTP
  • vscode运行c++文件和插件的方法
  • 鸿蒙 SplitLayout 组件解析:折叠屏分割布局与多端适配指南
  • 【NLP】使用 LangGraph 构建 RAG 的Research Multi-Agent
  • 前端项目3-01:登录页面
  • 教程 | 一键批量下载 Dify「Markdown 转 Docx」生成的 Word 文件(附源码)
  • 服务器的安装与安全设置
  • 机器学习18-强化学习RLHF
  • Excel基础:数据编辑
  • git 多用户管理 跨平台
  • dify小用
  • Miniconda+Jupyter+PyCharm初始环境配置
  • Linux命令:内置命令与外部命令的本质区别
  • 开疆智能CCLinkIE转ModbusTCP网关连接测联无纸记录仪配置案例