不同hive集群中基于表的数据一致性比对

    前阵子博主遇到一个需求,因对hadoop集群进行数据迁移,数据迁移完毕后进行两个hive库的数据一致性的比对,不仅对源表数据进行比对,而且要同时使用两个集群加工相同数据,对加工后的数据进行数据一致性比对。     博主已知的数据迁移方法有两种,第一种就是hadoop distcp功能来进行集群间数据的复制,那么基本就不用做源表的数据验证了,集群间数据复制失败会报错提示。     第二种方法
相关文章
相关标签/搜索