JavaSpark-数据读存-文本文件

在数据的存取中输出格式是很重要的,这利于下游处理程序。有时数据量达到本地没法存放时,就须要考虑别的存取方法 spark支持不少种输入源,由于spark是基于hadoop生态构建的,支持InputFormat和OutputFormat接口访问。而这两个接口也是map/reduce用来链接数据源的java API,同时(S3,HDFS,Cassandra,Hbase)等存储系统也支持这种接口。支持相同
相关文章
相关标签/搜索