基于Hadoop平台作大数据的几种应用

一、本身写MapReduce任务,虽然开发难度大一点,但运行效率比Pig和Hive高,像Google的PageRank排名,机器学习、推荐,全盘扫描的ETL都是这种方式的典型应用; 二、用Hive作分析,Hive的一大好处就是能使用程序员熟悉的SQL进行计算任务编写,但某些运算效率不及M/R; 三、用Pig作数据分析,Pig是Yahoo的研发成果,yahoo也但愿将其推广为大数据领域内的数据分析标
相关文章
相关标签/搜索