花15美元租台机器实现百万文档检索

Gwittr以twitter搜索为人所知,同时它还是一个统计信息的网站,除了提供有关推文及链接网页的扩展搜索,也进行数据的统计分析。这篇文章重点介绍如何在廉价(< /月)机器上运行一个中型、大型搜索(超过300万份文档)? 面临哪些挑战? 把这个问题丢给云计算既不便宜也不一定能得到解决; 避免为不必要存储空间支付过高的费用; 了解文档字段定义并针对检索需求做优化; 精心设计查询; 研究提交策略;
相关文章
相关标签/搜索