Hive表类型及使用技巧-拉链表

拉链表 一、数据加工和维护 概念: 所谓拉链表就是记录一个事物从开始 一直到当前状态的所有变化信息;通过比较,记录数据的生命周期,能够快速还原任意天的历史快照,而非全量的每天记录所有数据,因此极大节省了存储。 一般表名后面xxx_chain 数据加工方式: (1)拉链表中一般会存在一个字段“start_date”表示该记录的起始时间,不代表创建时间,非业务时间。一把会存在"createtime"表
相关文章
相关标签/搜索