Hive拉链表设计方案

一、拉链表的定义及使用场景 定义:所谓拉链,就是记录历史。记录一个事物从开始,一直到当前状态的所有变化的信息。 使用场景:举个栗子,现有一张内含1000万数据的订单表,每天都有100左右的订单状态会变化,因业务需求要回溯某个历史节点的一笔订单的状态。 现有两种处理方式: 1.比较原始的做法,对每天的数据做切片表,查看对应时间的切片表可以得到该订单的历史状态,但是若一笔订单在状态一天内多次变化,切片
相关文章
相关标签/搜索