hdfs dfs -getpython
hadoop fs,hadoop dfs和hdfs dfs命令的区别:fs既能操做本地文件又能操做分布式文件系统,而dfs只能操做HDFS分布式文件系统。hadoop dfs已经废弃编程
最后,streaming工具提供了丰富的参数来灵活控制做业的过程。网络
$HADOOP_HOME/bin/hadoop jar $HADOOP_HOME/hadoop-streaming.jar \ -input myInputDirs \ -output myOutputDir \ -mapper /bin/cat \ -reducer /bin/wc
任何可执行文件均可以被指定为mapper/reducer。这些可执行文件不须要事先存放在集群上; 若是在集群上尚未,则须要用-file选项让framework把可执行文件做为做业的一部分,一块儿打包提交。
例如:架构
$HADOOP_HOME/bin/hadoop jar $HADOOP_HOME/hadoop-streaming.jar \ -input myInputDirs \ -output myOutputDir \ -mapper myPythonScript.py \ -reducer /bin/wc \ -file myPythonScript.py