Spark读取文本文件并转换为DataFrame

本文首发于个人我的博客QIMING.INFO,转载请带上连接及署名。正则表达式 Spark ML里的核心API已经由基于RDD换成了基于DataFrame,为了使读取到的值成为DataFrame类型,咱们能够直接使用读取CSV的方式来读取文本文件,可问题来了,当文本文件中每一行的各个数据被不定数目的空格所隔开时,咱们没法将这些不定数目的空格看成CSV文件的分隔符(由于Spark读取CSV文件时,不
相关文章
相关标签/搜索