2014年初在工做中开始接触数据分析,平常工做主要集中于一个小型hadoop集群的运维以及hive操做。工做开始悠闲下来,要 静下心来好好沉淀一下大数据的相关知识体系,整理概括的同时要把在工做中用到的技术总结归并成本身的一套解决方案。初立博客,文章体系确定会比较杂乱,而 且大数据分析涉及到的东西自己就很杂,包括 Java,Linux,Hadoop,kfaka,hbase,hive,oozie,storm,redis,mcache等等,任重道远,但愿本身能 坚持下去。nginx
如下是架构设计图,包括实时分析和离线分析两条路线,以nginx开始,以bi结束。
redis