spark、hive、MR数据清洗的区别

Q:python 如题三者均可以进行数据清洗,区别是什么?各自使用场景是什么?spa A:内存 Spark处理任务比MR快,可是对内存消耗是很大的。spark 多数场景优先考虑hive进行数据清洗,少部分会单独编写MR或者Spark程序进行复杂处理。程序 Spark天然适合实时数据处理,例如公司如今放贷业务须要30s放款或拒绝,spark是最合适的。数据 若是不要求实时处理,只是单纯数据量大,MR
相关文章
相关标签/搜索