Hadoop综合大作业

作业来源于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3363 本次作业是在期中大作业的基础上利用hadoop和hive技术进行大数据分析 1.将爬虫大作业产生的csv文件上传到HDFS 2.对CSV文件进行预处理生成无标题文本文件         预处理:  使用awk脚本(com_pre_deal.sh)稍作处理,分隔开每一
相关文章
相关标签/搜索