5w2h构建数据仓库与sow
在数据仓库建设中,5w2h是一种结构化分析框架,用于全面规划和梳理数据仓库的核心目标、范围、逻辑和落地细节,确保建设方向清晰、需求明确
5W2H模型,不要理解得太复杂了,把它当作一个check list就好了。
比如在做需求的时候,问问需求方:
what,做什么;
why,为什么要做;
who,看什么体的数据or谁要看数据;
when什么时候要看,有没有DDL,是一天一次还是几个月看一次;
where想在什么地方看PC还是手机。
问完几个问题之后问问自己,
how,怎么实现,数仓实现还是写SQL取数?
how much,我投入多少的精力来应付这个需求?
除了对需求的时候,当你在做指标体系设计的时候,也可以如法炮制地问自己5W2H这几个问题。
what,这个指标体系是为了评价什么;
why,为什么要做这个指标体系;
who,这个指标体系是做给谁看的;
when,指标需要以什么样的时间粒度进行查看是合理的;
where,我需要的数据都在哪里;
how,数据怎么获得,从什么渠道获得;
how much,数据量有多少,怎么存储。
sow
statement of work 工作说明书 ,是指一份详细描述项目具体工作内容、范围、目标、交付物、时间表及双方责任的正式文件。
比譬在海航项目中我们就遇到一个问题,在验收标准上,报表的相应时间超过5s ,客户觉得太慢了,这块当时就没有写,后面的操作就比较麻烦。
科技这边的数据治理跟数仓的关系还是比较紧密的 ,主要是围绕数据质量