下面列出我搭建hadoop应用环境的文章整理在一块儿,不按期更新,供你们参考,互相学习!!!html
杂谈篇:mysql
【英语学习】 Re-pick up English for learning big data (not updated regularly) linux
【转】大数据工程师须要学习哪些? sql
【转】大数据东西辣么多,我该如何给本身一个清晰的定位呢? apache
【杂谈】大数据主流技术简介 服务器
第一篇 大数据主流技术之HADOOP部分框架
1.1 hadoop3.2.0的安装并测试 eclipse
1.2 编译Hadoop链接eclipse的插件碰见的一系列错误,崩溃的操做 分布式
第二篇 大数据主流技术之HIVE与HBASE部分
2.2 centos7下apache-hive-3.1.2-bin的安装测试
2.3 apache-zookeeper-3.5.5的安装测试
2.4 hbase-2.2.1配置独立的zookeeper的安装与测试
第三篇 大数据主流技术之SQOOP与ZOOKEEPER部分
3.2 安装部署kafka集群(kafka版本:kafka_2.12-2.3.0)
第四篇 内存计算主流技术之SPARK与SCALA部分
4.4 scala&sbt+idea+spark使用过程当中问题汇总(不按期更新)
4.5 spark应用(分布式估算圆周率+基于Spark MLlib的贷款风险预测)
脚本:
命令 :
Hadoop:
启动:sbin/start-all.sh 或 start-dfs.sh + start-yarn.sh
中止:stop-all.sh
启功历史服务器:sbin/mr-jobhistory-daemon.sh start jobhistoryserver
注:因Hadoop和Spark启动命令同样,故在设置环境变量时只设置其中一个
MySQL:
启动:service mysqld start
中止:service mysqld stop
状态:service mysqld status
Spark:
启动:sbin/start-all.sh
中止:stop-all.sh
idea:
启动:bin/idea.s
文件分享:
连接:https://pan.baidu.com/s/1e6zz4p-rCbzzE5DxMA4eFw
提取码:amdl