avatar

目录
数据仓库-业务数据仓库

参考:http://blog.sina.com.cn/s/blog_c30a9e680102z9ws.html

[toc]

电商业务与数据结构简介

数仓理论

表的分类

实体表

维度表

事务型事实表

周期型事实表

同步策略

实体表同步策略

维度表同步策略

事务型事实表同步策略

周期型事实表同步策略

范式理论

关系建模与维度建模

雪花模型、星型模型和星座模型

数仓搭建

业务数据生成

业务数据导入数仓

Sqoop安装

需要将json的jar包扔到lib下,不然会报错。

Sqoop定时导入脚本

ODS层

创建ods层的表

ODS层数据导入脚本

DWD层

积压ODS层对数据进行判空过滤。对商品分类表进行维度退化(降维)。

DWS层之用户行为宽表

GMV成交总额

ADS层

转化率

ADS层之新增用户占日活跃用户比率

ADS层之用户行为漏斗分析

品牌复购率

DWS层

用户购买商品明细表(宽表)

ADS层

品牌复购率结果输出到MySQL

Azkaban调度器

Azkaban安装

复购率指标的产生的全调度流程

订单表拉链表

什么是拉链表

为什么要做拉链表

拉链表形成过程

拉链表制作过程图

拉链表制作过程

OLAP分析工具之Presto

Presto Server安装

Presto命令行Client安装

Presto可视化操作

项目总结

文章作者: Machine
文章链接: https://machine4869.gitee.io/2019/12/11/20191211154140441/
版权声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 哑舍
打赏
  • 微信
    微信
  • 支付宝
    支付宝

评论