Hive 操做与应用 词频统计

1、hive用本地文件进行词频统计数据库

1.准备本地txt文件 oop

 

 

 

2.启动hadoop,启动hive3d

 

 

 

3.建立数据库,建立文本表 blog

 

 

 

4.映射本地文件的数据到文本表中hadoop

                               

 

 

 

5.hql语句进行词频统计交将结果保存到结果表中。文件上传

 

 

 

 

 

6.查看统计结果im

 

 

2、hive用HDFS上的文件进行词频统计d3

1.准备电子书或其它大的文本文件统计

 

 

2.将文本文件上传到HDFS上数据

 

 

3.建立文本表

 

 

4.映射HDFS中的文件数据到文本表中

 

 

5.hql语句进行词频统计交将结果保存到结果表中

 

 

 

 

6.查看统计结果

 

 ... ...

相关文章
相关标签/搜索