【机器学习实战-python3】大数据与MapReduce

本篇的数据和代码参见:https://github.com/stonycat/ML-in-Action 一、MapReduce:分布式计算的框架 MapReduce 优点:可在短时间内完成大量工作。 缺点:算法必须经过重写,需要对系统工程有一定的理解。 适用数据类型:数值型和标称型数据。 Google公司的Jeffrey Dean和Sanjay Ghemawat在2004年的一篇论文中第一次提出了
相关文章
相关标签/搜索