《Clojure数据分析秘笈》——2.6节调整词频值的度量

本节书摘来自华章社区《Clojure数据分析秘笈》一书中的第5章,第2.6节调整词频值的度量,作者(美)Eric Rochester,更多章节内容可以访问云栖社区“华章社区”公众号查看 2.6 调整词频值的度量 标准化数值的一种方式是根据组的大小来度量其频率。例如,单词truth在一个文档中出现三次。如果这个文档有30个单词是一种意义,然而如果这个文档有300个单词或者3000个单词就会有不同的意
相关文章
相关标签/搜索