在项目实战后,大家应该对数据仓库的整体流程有了一个较为清晰的认识。除了复购率的计算,接下来在原有数仓已经搭建成功的基础上,尝试着来完成 GMV 的计算任务,巩固知识的同时也体会下真实的工作内容。下面讲解和分析具体的作业内容。
作业内容
计算 GMV(成交总额),需要计算的字段如图所示,包含付款和未付款部分;最终将结果导出到 MySQL。
要求:独立编写为 Shell 脚本,使用 Azkaban 进行自动化调度。
提示:依赖的表为 dws_user_action。
作业分析
因为数据仓库已经建成,所以只需要对 DWS 层的数据进行分析即可。经过分析,发现 GMV 的计算,可以基于用户行为宽表来进行。
统计日期,可以通过当前时间来确定。订单数量只需要统计下单次数,订单总金额统计下单金额,当日支付金额统计支付金额即可。
接下来大家可以基于之前的学习材料,自主完成练习,下一节公布作业答案。