Hadoop综合大作业

1.用Hive对爬虫大作业产生的文本文件(或者英文词频统计下载的英文长篇小说)进行词频统计。 启动hadoop   Hdfs上创建文件夹 data 为名字 上传文件至hdfs 启动Hive 创建原始文档表 导入文件内容到表docs并查看 导入   查看    用HQL进行词频统计,结果放在表word_count里 查看统计结果 结果有3万多行 所以只截图其中几行来当例子       2.用Hive
相关文章
相关标签/搜索