大数据中的一些名词

TF(Term Frequency) 表示某个关键词在整篇文章中出现的频率。web IDF(InversDocument Frequency) 表示计算倒文本频率。文本频率是指某个关键词在整个语料全部文章中出现的次数。倒文档频率又称为逆文档频率,它是文档频率的倒数,主要用于下降全部文档中一些常见却对文档影响不大的词语的做用。分布式 HDFS(Hadoop Distributed File Syst
相关文章
相关标签/搜索