Spark实例TopN---Spark学习笔记11

Spark是基于内存的分布式计算框架,性能是十分彪悍的。java 话接上回,部署完Spark集群以后,想要测试一下,Spark的性能。python 一、环境 集群概况能够参见Spark Hadoop集群部署与Spark操做HDFS运行详解。web 如今集群里有一大约7G的文件,是手机号和IP地址的组合。sql hadoop dfs -dus /dw/spark/mobile.txt hdfs://
相关文章
相关标签/搜索