hive建模分析

建模分析

  • 基于访客系统的案例来进行讨论

建模分析目的

  • 分析出整个数仓须要哪些层次,哪些表,哪些字段
  • ODS层:源数据层im

    • 对接源数据,保持和源数据相同粒度
  • DWD时间戳

    • 任务:
    • 1.清洗。统计

      • 不完整数据
      • 过时或者无效数据
    • 2.转换数据

      • create_time->年月日
      • 或时间戳
    • 3.能够适当维度退化,减小表的关联
  • DWM:中间层时间

    • 进一步对明细层进行聚合,譬如能够将日的记录先合并,在后期记录月时能够更方便的合并
  • DWS: 业务层time

    • 细化聚合统计,
  • APP:应用层系统

    • 对细化统计结果再次分析
    • 能够省略
  • DIM:维度层

    • 放置维度表数据
相关文章
相关标签/搜索