缓慢变化维之拉链表

场景: 业务库中的订单表中的某些维度随着时间的推移会慢慢变化,如果对于每次变化都是对原有数据的覆盖,则无法看到历史信息 对于这种情况,可以使用拉链表来解决。 相比于每天全量的导出业务数据到hive中存备份,使用拉链表的好处就是减少大量的冗余数据,并且也可以达到查看历史信息。 实现:  第一次从业务库中导入全量数据到hive中作为初始化的拉链表A,且增加两个字段:有效时间起(start_time)和
相关文章
相关标签/搜索