信息检索模型与评估

信息检索的前提是对信息内容的索引提取,所谓的索引就是指用于标识信息内容的项。创建信息的索引的方法,一般可分为两类:一种是手动定义索引,一种是自动获取索引。而咱们所要面临的数据源,既多是模块化或结构化的语言,譬如HTML语言,又多是非结构化的语言,譬如天然语言;既多是与上下文相关的词汇,又多是与上下文无关的词汇;既多是一个简单的单词又多是一个词组(这里的数据源前提假设为英文,对于中文的信息检索,因为
相关文章
相关标签/搜索