wordstat中帮助文件翻译版(一)extraction of topics部分

提取的话题 stat的主题提取特征试图通过自然语言处理和统计分析相结合的方法来揭示文本集合中隐藏主题结构。 WordStat中用于主题提取的主要统计过程是因子分析。从技术上讲,这种抽取是通过按文档频率矩阵计算单词来实现的,或者也可以通过将文档分割成更小的块并按段频率矩阵计算单词来实现的。一旦得到了这个矩阵,就需要进行可变旋转的因子分析,以提取少量的因子所有因子加载高于特定标准的单词将作为提取主题的
相关文章
相关标签/搜索