Hive_Hive 中的虚拟列 以及 使用场景示例

Hive 在 0.8 之后提供了几个虚拟列,虚拟列在平时作用并不大, 但是对于Hive, 前序ETL中可能由逻辑等产生的清洗异常,还是有很大帮助的,可以快速定位出错的文件!!!     在实际使用中,我遇到了这样的问题,在清洗日志中,由于上层的日志清洗导致数据的某些列过长, 此时需要快速定位出错的文件。这个时候就可以用到虚拟列了。 hive 的虚拟列 主要有以下几个参数 INPUT__FILE__
相关文章
相关标签/搜索