说明
:如遇到报错没有hadoop命令,请从新执行source hadoop-env.sh
。后续的实验中同理。java
一、HDFS是Master和Slave的结构,分为NameNode、Secondary NameNode和DataNode三种角色。node
二、HDFS经常使用命令mysql
①. hadoop fs 将本地文件上传到hdfs,同时删除本地文件。web
hadoop fs -ls / hadoop fs -lsr hadoop fs -mkdir /user/hadoop hadoop fs -put a.txt /user/hadoop/ hadoop fs -get /user/hadoop/a.txt / hadoop fs -cp src dst hadoop fs -mv src dst hadoop fs -cat /user/hadoop/a.txt hadoop fs -rm /user/hadoop/a.txt hadoop fs -rmr /user/hadoop/a.txt hadoop fs -text /user/hadoop/a.txt hadoop fs -copyFromLocal localsrc dst 与hadoop fs -put功能相似。 hadoop fs -moveFromLocal localsrc dst
② hadoop fsadmin 运行一个 HDFS 的 dfsadmin 客户端sql
shell
数据库
编程
安全
bash
③hadoop fsck 运行 HDFS 文件系统检查工具。
用法:hadoop fsck [GENERIC_OPTIONS] <path> [-move | -delete | -openforwrite] [-files [-blocks [-locations | -racks]]]
④启动 Hadoop
cd /app/hadoop-1.1.2/bin
./start-all.sh
三、Pig的调用方式:
四、Hive与关系数据库的区别具体以下:
①Hive和关系数据库存储文件的系统不一样,Hive使用的是Hadoop的HDFS(Hadoop的分布式文件系统),关系数据库则是服务器本地的文件系统;
②Hive使用的计算模型是Mapreduce,而关系数据库则是自身的计算模型;
③关系数据库都是为实时查询的业务进行设计的,而Hive则是为海量数据作数据挖掘设计的,实时性不好;实时性的区别致使Hive的应用场景和关系数据库有很大的不一样;
④Hive很容易扩展本身的存储能力和计算能力,这个是继承Hadoop的,而关系数据库在这个方面要比数据库差不少。
五、组件
服务端组件:
客户端组件: