文本表示与tf-idf

文本本身属于非结构化数据,而且我们要知道非结构化数据是不能直接作为模型的输入的。 如何把一个单词表示成向量? 第一种,也是最简单的表示法叫作独热编码的表示。 词典:[机器,学习,有,意思,人工智能,是,未来] 每个单词的表示: 机器:(1,0,0,0,0,0,0) 学习:(0,1,0,0,0,0,0) 意思:(0,0,0,1,0,0,0) 未来:(0,0,0,0,0,0,1) 单词的表示了解完了,
相关文章
相关标签/搜索