数据分析-数据指标体系搭建及应用
数据指标体系概述
数据指标概述
指标和维度
指标
维度
数据指标分类
北极星指标是总的业务目标,对北极星指标进行业务目标的拆解,可以得到各个指向业务结果的目标,就是结果指标,达成业务结果过程中涉及的指标就是过程性指标,有些指标不属于以上3种,但在实际运营中非常重要,比如商品库存,可以归入运营指标。
原子指标是基础指标,不可以拆分,直接基于数据源计算,比如销售量、销售额、订单数等。派生指标是基于原子指标计算得出的,依赖多个原子指标,比如客单价=销售额/订单数。
数据指标评价标准
好的数据指标简单易懂
好的数据指标具有可比性(从同比、环比角度去看一个业务员的销售业绩)
好的数据指标是一个比率
好的数据指标会改变行为(如果用复购率、推荐率衡量顾客满意度可以在用户复购率下降时及时调整运营策略提升用户满意度,如果用投诉率、退货率衡量,当投诉率上升时再去调整,肯已经开始流失用户了了)
数据指标要点
警惕虚荣指标,选择可执行的指标(总注册用户数是一个虚荣性指标,更应该关注活跃用户占比)
先见性指标与后见性指标都很重要(订单量对销售部门而言是后见性指标,对于财务部门是先见性指标,因为财务部门可以根据订单量计算销售额)
区分相关性指标和因果性指标(冰淇淋销量与意外溺水是相关关系,不是因果关系)
数据指标体系概述
数据指标体系搭建
数据指标体系构建流程
数据指标体系如何落地
数据指标体系构建举例
数据指标体系建模
数据模型
数据模型就是数据组织和存储方法,它强调从业务、数据存取和使用角度合理存储数据。
维度建模
维度建模概念
维度建模是一种数据仓库的建模方法(ER模型,Data Vault模型、Anchor模型等),它从分析决策的需求服务,因此它重点关注用户如何更快速地完成需求分析,同时具有较好的大规模复杂查询的响应性能。其典型代表就是星型模型。
维度建模相关表
事实表
事实表又叫明细表,表示业务开展二产生的结果记录。
维度表
维度表又叫查找表,通常用来做分析问题的角度。
常见数据模型
星型模型
星形模型是一种简单的数据模型。在星形模型中只有一张事实表,事实表与维度表之间通过主键与外键连接,维度表之间不存在关联关系,所有维度表都与事实表相关联。
雪花模型
雪花模型是星形模型的扩展,其造型类似于雪花。在雪花模型中,一个或者多个维度表并不直接与事实表相关联,而是通过其他的维度表与事实表相关联。
星座模型
星座模型也是星形模型的一种扩展,也叫星系模型。不同于星形模型,星座模型有多个事实表,不同的事实表之间共享维度表,常用于复杂的数据关系场景。
数据指标体系应用
KPI关键绩效指标
关键绩效指标是通过对组织内部流程的输入端、输出端的关键参数进行设置、取样、计算、分析,衡量流程绩效的一种目标是量化管理指标,是把企业的战略目标分解为可操作的工作目标的工具,是企业绩效管理的基础。
KPI指标案例
KPI指标连续不达标次数的案例。
规则说明:
当周末未达标计入为1,当周达标计入为0
基于最近一次达标情况,统计连续不达标次数
表中的KPI分为两种,一种是增长型,一种是下降型;比如KPI_01是增长型KPI,在14周要达到100%,数值要越大越好,KPI_06是下降型KPI,在14周不能超过5%,数值越小越好。
先根据周目标和周实绩这两张表格判断每周的KPI是否达标,先用周实绩减去周目标,再乘以指标类型(1或-1)。
对于增长型KPI,如果结果是正数,说明达标了,赋值为0
对于下降型KPI,如果结果是正数,就说明达标了,赋值为0
由于周实绩表有缺失值,计算时会出现错误,出现错误时返回0
计算公式:=IFERROR(IF((T5-F5)*$D5>=0,0,1),0)
得到每周是否达标的表格后,计算连续不达标次数。通过查找每个KPI最后一个达标的周次,计算连续不达标次数,比如在22周是最后一个达标的,那么23~26周都没有达标,26-22=4,连续4次不达标。
计算基准值=LOOKUP(1,0/ISTEXT(AH4:AT4),AH4:AT4) ,AH4:AT4是W14~W26
ISTEXT(AH4:AT4)返回逻辑值,如果是文本返回True,否则返回False;0/ISTEXT(AH4:AT4)返回#DIV/0!或0,如果是0/True(1)返回的是0,0/False(0)返回的是#DIV/0!,LOOKUP函数会自动忽略错误,返回小于等于查找值的最大值,这里查找的值是1,那么返回的就是0,在AH4:AT4中查找最后一个被标记为0的单元格,也就是W26。
SUBSTITUTE($AU$2,"W","")*1,AU2是上述公式的结果W26
将W26中的W替换,变成文本26,*1将文本转换为数字
SUBSTITUTE(LOOKUP(1,0/(AH6:AT6=0),$AH$4:$AT$4),"W","")*1
以第一个KPI为例,达标表格的第一行,AH6:AT6=0判断每周的值是否为0,如果是0返回True,否则返回False,0/True(1)返回的是0,0/False(0)返回的是#DIV/0!,LOOKUP函数会自动忽略错误,返回小于等于查找值的最大值,这里查找的值是1,那么返回的就是0,在AH4:AT4中查找最后一个被标记为0的单元格,这里返回的是W23。再将W23转换为数字。
SUBSTITUTE($AU$2,"W","")*1 - SUBSTITUTE(LOOKUP(1,0/(AH6:AT6=0),$AH$4:$AT$4),"W","")*1
返回的差值就是连续不达标的次数
如果返回的是错误,说明每周的KPI都没有达标,也就是所有值都为1,即连续13周都未达标,用COUNTA($AH$4:$AT$4)计算,计算AH4:AT4中的非空单元格。
完整公式:=IFERROR((SUBSTITUTE($AU$2,"W","")*1- SUBSTITUTE(LOOKUP(1,0/(AH5:AT5=0),$AH$4:$AT$4),"W","")*1),COUNTA($AH$4:$AT$4))
数据指标监控体系
监控体系案例
数据异动分析
数据异动分析的流程可以概况为问题界定、维度拆解分析问题、量化数据异动贡献度三大步骤。
方法论
概述
排除数据传输问题引起的波动
排除周期性波动
排除内部因素的影响
排除外部因素的影响
通过逻辑树方式,维度拆分逐步排查
排除数据传输问题引起的波动
是否为数据录入异常
是否为数据同步异常
是否为数据查询异常,检查SQL语句
排除周期性波动
排除内部因素影响
排除外部因素的影响
通过逻辑树方式,维度拆分逐步排查
基于维度拆分分析的案例
先将表格转换为超级表,加载到PowerQuery,检查数据类型之后关闭并上载至-仅创建连接,勾选将数据加载到数据模型。进入PowerPviot,设计-日历-日期-新建。新建一个日期表,表明‘日历’,在日历表中新增一列‘年月=FORMAT('日历'[Date],"yyyy-mm")’。
在关系视图里建立表的联系,根据商品编码关联商品信息维度表和商品销售明细表,根据门店编码关联门店信息维度表和商品销售明细表,根据Date关联日历表和商品销售明细表。
书写度量值,全部度量值如下:
商品销售额:=SUM('商品销售明细表'[销售额])
商品成本额:=SUM('商品销售明细表'[成本额])
商品毛利额:=[商品销售额]-[商品成本额]
商品毛利率:=DIVIDE([商品毛利额],[商品销售额])
上个月销售额:=CALCULATE([商品销售额],DATEADD('日历'[Date],-1,MONTH))
上个月毛利额:=CALCULATE([商品毛利额],DATEADD('日历'[Date],-1,MONTH))
上个月毛利率:=CALCULATE([商品毛利率],DATEADD('日历'[Date],-1,MONTH))
销售额环比增长率:=DIVIDE([商品销售额]-[上个月销售额],[上个月销售额])
毛利额环比增长率:=DIVIDE([商品毛利额]-[上个月毛利额],[上个月毛利额])
毛利率环比增长率:=DIVIDE([商品毛利率]-[上个月毛利率],[上个月毛利率])
点击数据透视表,选择新工作表。行标签选择日历表的年月,筛选前八个月份,将销售额环比增长率、 毛利额环比增长率和毛利率环比增长率拖到值,生成三个表格并可视化。
从图中可以看出八月份的销售额确实有所增长,但是八月份的毛利额和毛利率却降低了。
筛选出八月份的数据分析数据波动原因,先根据地区分类观察是否异常,发现湖南省的商品毛利率比其他省份低很多,可能是湖南省的门店导致毛利率异常,进一步筛选发现长沙市的长沙梅溪湖店毛利率异常,再分析时哪种商品类别导致的异常,发现零食类的德芙巧克力毛利率异常。查看时哪天出现异常,发现是17号这天异常,最后查看17号毛利率异常的单据编号,统计共有99笔异常订单。