Spark每日半小时(19)——CSV、SequenceFile、对象文件

CSV 逗号分隔值(CSV)文件每行都有固定数目的字段,字段间用逗号隔开(在制表符分隔值文件,即TSV文件中用制表符隔开)。记录一般是一行一条,不过也不老是这样,有时也能够跨行。CSV文件和TSV文件有时支持的标准不一致,主要是在处理换行符、转义字符、非ASCII字符、非整数值等方面。CSV原生并不支持嵌套字段,因此须要手动组合和分解特定的字段。java 与JSON中的字段不同的是,这里的每条记录
相关文章
相关标签/搜索