参考:http://blog.sina.com.cn/s/blog_c30a9e680102z9ws.html
[toc]
电商业务与数据结构简介
数仓理论
表的分类
实体表
维度表
事务型事实表
周期型事实表
同步策略
实体表同步策略
维度表同步策略
事务型事实表同步策略
周期型事实表同步策略
范式理论
关系建模与维度建模
雪花模型、星型模型和星座模型
数仓搭建
业务数据生成
业务数据导入数仓
Sqoop安装
需要将json的jar包扔到lib下,不然会报错。
Sqoop定时导入脚本
ODS层
创建ods层的表
ODS层数据导入脚本
DWD层
积压ODS层对数据进行判空过滤。对商品分类表进行维度退化(降维)。
DWS层之用户行为宽表
GMV成交总额
ADS层
转化率
ADS层之新增用户占日活跃用户比率
ADS层之用户行为漏斗分析
品牌复购率
DWS层
用户购买商品明细表(宽表)
ADS层
品牌复购率结果输出到MySQL
Azkaban调度器
Azkaban安装
复购率指标的产生的全调度流程
订单表拉链表
什么是拉链表
为什么要做拉链表
拉链表形成过程
拉链表制作过程图
拉链表制作过程
OLAP分析工具之Presto
Presto Server安装
Presto命令行Client安装
Presto可视化操作
项目总结