【原】Learning Spark (Python版) 学习笔记(二)----键值对、数据读取与保存、共享特性...

  原本应该上周更新的,结果碰上五一,懒癌发做,就推迟了 = =。之后仍是要按时完成任务。废话很少说,第四章-第六章主要讲了三个内容:键值对、数据读取与保存与Spark的两个共享特性(累加器和广播变量)。html 键值对(PaiRDD)python 1.建立程序员 1 #在Python中使用第一个单词做为键建立一个pairRDD,使用map()函数 2 pairs = lines.map(lamb
相关文章
相关标签/搜索