GraphX对edgelist文件格式的要求

前阵子踩过的一个坑,发朋友圈了,转过来记录一下。 是关于GraphX读取edgelist文件失败的问题,报invalid line错误。后来从《Spark GraphX图计算核心源码分析【图构建器、顶点、边】》查到,GraphX能识别的edgelist文件的格式,两列之间用一个或多个空格分隔,而不能是用逗号分隔的csv。如下图所示。973GB的文件再处理一遍我找谁说理去。。。。。
相关文章
相关标签/搜索