Spark的RDD原理以及2.0特性的介绍

      注:本文由王联辉在高可用架构群分享,本文转载自高可用架构「 ArchNotes 」       王联辉,曾在腾讯,Intel 等公司从事大数据相关的工作。2013 年 – 2016 年先后负责腾讯 Yarn 集群和 Spark平台的运营与研发。曾负责 Intel Hadoop 发行版的 Hive 及 Hbase 版本研发。参与过百度用户行为数据仓库的建设和开发,以及淘宝数据魔方和淘宝指
相关文章
相关标签/搜索