信息检索

搜索文档或文档中信息的科学。文档能够是文本或多媒体,而且可能驻留在Web上。 信息检索与数据库系统的差异:信息检索假定所搜索的数据是无结构的;信息检索查询主要用关键词,没有复杂的结构。 主题模型:一个文本文档集的主题能够用词汇表上的几率分布建模。web 文件类型检测 语言检测 检测文件语言类型检测特定字符 使用split()对文本内容进行区分,区分不一样词语,进行标记 标记化数据库 倒排索引svg
相关文章
相关标签/搜索