lucene全文搜索

lucene是一个基于java的高效的全文搜索库。     咱们的生活中的数据整体分为两种: 结构化数据和非结构化数据。     结构化数据:指具备固定格式或者有限长度的数据。如数据库,元数据等     非结构化数据:指不定长或无固定格式的数据,如邮件,word文档等     固然还会有第三种,半结构化数据,如xml,html 等,当根据须要可按结构化数据来处理,也可抽取出纯文本按非结构化数据来处
相关文章
相关标签/搜索