离线数据清洗,Spark和Python Pandas对比

导语 最近新学习了Spark中RDD的核心用法,为了巩固学习成果,因而使用Spark写了一个数据清洗的代码,正好以前使用过python中pandas对一样的数据作数据清洗,因而就把两种方式的代码都贴出来,作一个简单的对比python 数据展现 豆瓣图书标签: 小说,[日] 东野圭吾 / 李盈春 / 南海出版公司 / 2014-5 / 39.50元,解忧杂货店,8.6,(297210人评价) 豆瓣图
相关文章
相关标签/搜索