HADOOP综合大作业

1.用Hive对爬虫大作业产生的文本文件(或者英文词频统计下载的英文长篇小说)进行词频统计。    (1)开启所有的服务,并创建文件夹wwc (2)查看目录下所有文件   (3)把hdfs文件系统中文件夹里的文本文件load进去。   (4)进入hive,并查看所有的表   (5)创建表word,,写hiveQL命令统计   (6)运行结果   2.用Hive对爬虫大作业产生的csv文件进行数据分
相关文章
相关标签/搜索
本站公众号
   欢迎关注本站公众号,获取更多信息