代码+案例详解:使用Spark处理大数据最全指南(下)

  Spark应用实例 接下来用具体实例解决一些常见的转换。 所研究的数据集是Movielens(https://github.com/MLWhiz/spark_post),该数据集是一个稳定基准数据集。1700部电影中的1000名用户给出了100000份评分,发布于1998年4月。   Movielens数据集包含大量文件,但本文仅处理3个文件: 1. 用户: 此文件名为 “u.user”, 文
相关文章
相关标签/搜索