全文检索系统技术架构及流程说明

技术架构图 java 索引的建立 根据文件来源,分为hadoop数据和oarcle数据两类。 (1) hadoop数据 在线网盘的文本文件和非文本文件都保存在hadoop的hdfs或hbase数据表中,推荐系统的网页文件也保存在hbase表中。这些文件经过tika、Jsoup等文本提取或文本解析工具将文件名、文本内容、网页文字内容等可索引数据解析出来保存在hbase表的对应字段中,而后经过ES-H
相关文章
相关标签/搜索