文本挖掘学习笔记(一)—布尔检索

      最近在学习文本挖掘,故而把书中关键的内容做个笔记,方便以后查阅。       信息检索是从大规模非结构化数据(通常是文本)的集合(通常保存在计算机上)中找出满足用户需求的资料的(通常是文档)的过程。按照所处理的数据的规模,信息检索可以分为三个级别:         第一个级别是以web搜索为代表的大规模级别;         第二个级别是小规模,可以看成是与第一种规模相对的另一极端情况
相关文章
相关标签/搜索