全文检索基本原理

什么是全文检索? 我们生活中的数据总体分为两种:结构化数据和非结构化数据。 * 结构化数据:指具有固定格式或有限长度的数据,如数据库,元数据等。 * 非结构化数据:指不定长或无固定格式的数据,如邮件,word文档等。   当然有的地方还会提到第三种,半结构化数据,如XML,HTML等,当根据需要可按结构化数据来处理,也可抽取出纯文本按非结构化数据来处理。 非结构化数据又一种叫法叫全文数据。 按照数
相关文章
相关标签/搜索