【大数据分析经常使用算法】0.简介

简介

本系列教程主要探讨有关大数据的全部经常使用算法的实现,按期加入有趣的项目实践。java

一、实现语言

初步使用java实现,后续加入python。python

  • Hadoop Mapreduce Java实现 位于包*.mapreduce下。
  • Spark MapReduce Java实现 位于包*.spark下。

python实现会在之后加入。算法

每一个算法存在一个模块,测试文件位置父模块根目录下,对应名字可从系列教程里面找到。框架

二、实现框架

  • Hadoop 2.7.3
  • Spark 2.4

三、参考

  • 书籍《算法实现:Hadoop/spark》
相关文章
相关标签/搜索