大数据采坑集-导入数据到hive的换行符问题

问题描述 我们通常在迁移数据到大数据环境中,会使用,sqoop、datax之类的etl工具,从数据库中迁移到hive或hdfs。数据库中的原始数据中的文本类数据难免会有特殊字符,比如换行符,会对导入Hive后的数据产生影响。下面是从mysql导入hive的数据,其中,hive表是textfile格式存储特殊字符没做处理: 发现有两个字段没了,于是再看看hive表在hdfs上的文件: 发现原本一行的
相关文章
相关标签/搜索