Whoosh 原理与实战1--Python 搜索框架 Whoosh 简介

       Whoosh 是一个纯 Python 编写的搜索框架,相似于Lucene。比较简单,能够快速构建站内搜索。也能够在此基础上构建搜索引擎,但须要本身扩展 爬虫Spider 和 中文分词组件。 框架

Whoosh详细能够查看 http://www.oschina.net/p/whoosh ide

      最近构思了一个我的网站,准备采用 Python 开发,主要看重 Python 快速构建能力(固然,我不太会 Python,这也算一个 Python的学习做品,开发不必定快哈)。网站初步包括新闻、博客、社区,这三个版块须要站内搜索;同时有一个资讯版块,须要构建一个主题搜索引擎。这里都采用 Whoosh 做为基础,而后本身实现 Spider、中文分词完成。 学习

下面将逐步介绍: 网站

1. Whoosh 原理与实战 搜索引擎

2. Python 中文分词设计与开发 spa

3. Spider 设计与开发 .net

因为须要边学习边写做,这只能算做个人 Python学习笔记。可能一些内容不太准确、合理,但愿你们指正。 设计

相关文章
相关标签/搜索