##关键词提取技术html
TF(词频)-IDF(逆文档频率)框架
http://www.ruanyifeng.com/blog/2013/03/tf-idf.html工具
中文分词ui
工具对比 https://my.oschina.net/apdplat/blog/412921.net
分词方案 https://www.zhihu.com/question/19578687code
分析非结构化内容(好比文本、视频和音频)框架 uima视频
淘宝的评论概括htm
https://www.zhihu.com/question/20905103blog
同义名词和形容词的合并文档
可选分方法比较多,使用相关系数计算两个词之间的类似度,或者使用SimRank,或者使用word2vec,我采用的第一种,简单关键是效果不错。其实,形容词的类似是有词典能够用的,可是直接用确定是不行的。