Spark词频统计测试(白话版二十四史)

数据:中华书局白话版二十四史,总计大小93M,已经存放到HDFS集群pythonSpark 1.6.0jieba(结巴分词)D3.JSfrom  pyspark import SparkConf, SparkContext第一个被授予节度使称号的是唐睿宗(武则天的儿子)时期的左武卫大将军兼幽州都督薛讷,他也是大名鼎鼎的薛仁贵的儿子。
相关文章
相关标签/搜索