搜狗日志查询分析 (MapReduce+Hive综合实验)

下载搜狗实验室查询日志,发现编码是UTF-8。 将SogouQ文件夹下的文件从GBK编码转为UTF-8编码,结果存到SogouQ_UTF8中,其下的文件目录不变: shell命令: find SogouQ -type d -exec mkdir -p SogouQ_UTF-8{} \; find SogouQ -type f -exec iconv -f GBK -t UTF-8 {} -o So
相关文章
相关标签/搜索