这是个人博客系列“ Elasticsearch简介”的第一篇文章。本系列旨在指导您入门Elasticsearch,了解其功能,现实生活中的用例以及熟悉Elasticsearch堆栈中的其他组件。该博客将为您简要介绍Elasticsearch,其提供的解决方案以及选择Elasticsearch服务的缘由。数据库
若是你已经了解Elasticsearch是怎么回事,开始着手搭建,那我推荐你看这篇:elasticsearch初学终极教程: 从零到一服务器
1、什么是Elasticsearch?
这是新手碰到的第一个问题!我来归纳如下:
Elasticsearch是一个NoSql数据库,其搜索引擎基于Lucene构建。Elasticsearch提供了一个分布式的,基于JSON的实时,多租户的全文搜索解决方案。
即便上面的定义仅用两句话就结束了,但您仍是不会听到不少术语。让咱们拆分它们并分别进行探索
1 Lucene
简而言之,Lucene是一个用Java编写的库。所以,下一个显而易见的问题是它的做用和功能是什么!
Lucene是一个搜索库。这意味着,有一些用Java编写的函数和方法已针对不一样的搜索策略进行了优化。Lucene是有史以来最受欢迎的搜索库。大多数开源/商业搜索实现都以Lucene为骨干。
所以,在阅读了上面对Lucene的定义以后,出现了一系列问题,例如,若是Elasticsearch将Lucene用于搜索部分,为何咱们不能将裸露Lucene用于咱们的目的呢?为何选择Elasticsearch?或者,Elasticsearch和Lucene有什么区别?
这些问题的答案是,Lucene是一个编写得很是出色的库,这也使得在根据最终客户需求进行定制时很难处理。所以,Elasticsearch所作的就是在Lucene之上构建一个API层,这将使Lucene方法和功能的使用变得很是简单。
2.分布式系统
除了在咱们的应用程序中配置Lucene的难以置信的困难以外,使Elasticsearch优于Lucene的缘由是前者的分布式特性。从本质上讲,分布式意味着Elasticsearch能够同时在不一样的系统/节点上运行,并尝试利用网络中的系统资源来解决单个问题。Lucene不支持此功能,它是许多实现的主要障碍。
3.实时搜索
插入Elasticsearch的文档几乎能够当即用于搜索。此功能开箱即用,无需外部/附加配置。
4.基于JSON
Elasticsearch使用基于JSON的通讯。这意味着它将JSON格式用于API和其余通讯。因为当今大多数Web应用程序和服务都以JSON进行通讯,所以这在使用和互操做性方面提供了极大的灵活性。
5.多租户能力
多租户是指一种应用程序的架构,其中服务器/云上的应用程序实例能够由具备不一样级别可访问性选项的多个租户(用户组)访问。
2、Elasticsearch-用例
1.搜索
Elasticsearch的主要用例和目的是使“搜索”更快,更好。所以,搜索是Elasticsearch的第一个用例。它提供了许多搜索策略,例如开箱即用的大小写相关/独立搜索,部分匹配,自动建议搜索。一样,根据用户依赖的策略(例如选择性加权,突出显示等)对搜索进行大量定制很是容易在Elasticsearch中构建和实现。这些因素使其成为搜索操做中最多见的选择。
2.日志收集/解析和分析
Elasticsearch与堆栈的其余成员(例如Logstash)和Beats平台使从各类来源收集数据变得很是容易和顺畅。Logstash和Beats使来自各类来源的数据转发变得容易,而且因为它们与Elasticsearch的本机集成,在Elasticsearch中设置和开始收集数据很是容易。
Elasticsearch在这里解决的问题是须要来自不一样来源的不一样数据处理程序。也就是说,若是您要从不一样来源收集日志并须要对日志进行标准化,则可使用Elasticsearch的Logstash轻松处理此过程的数据转发和数据解析解析应用。所以,使用这种方法能够解决许多中间步骤,以及由此花费的时间和精力来制做标准格式。
使用Elasticsearch的可视化工具Kibana能够轻松可视化已解析和保存的数据。Elasticsearch的功能内置了许多类型的分析功能,例如不一样类型的聚合和许多统计计算,它们能够应用于日志,而后使用Kibana进行交互式可视化,以获取有关日志数据的有用看法。
3.内容链接器
就像上一节中提到的日志同样,Elasticsearch的下一个最大用例是来自众多来源的数据收集
如Twitter,Sharepoint,JIVE等。有强大的社区链接器插件可提取数据,并具备来自各类来源的所需自定义并将其添加到Elasticsearch中。反过来,这不只能够为特定目的提供强大的数据收集,还可使其变得可搜索。例如:能够未来自特定主题标签的数据流式传输到Elasticsearch,而后,若是咱们可以对该数据进行快速的搜索,请想象简化用户所需内容的简便性。卫报新闻社正在使用相似的实现方式,在那里将其新闻的最新评论流式传输到Elasticsearch。而后,对这些数据进行分析并使其可搜索,以便他们能够尽快找到文章的趋势。
4.即时可视化
快速数据可视化功能可在Elasticsearch中创建数据索引后的几分钟内建立具备洞察力的仪表板,这也是Elasticsearch堆栈的主要用例之一。Elasticsearch提供的可视化工具是Kibana,它能够依次加载来自Elasticsearch的数据并能够对它们进行大量分析,而后将其呈现为各类图表,能够按照任何顺序排列以建立报告/仪表板。应用程序监视区域可使用Kibana -Elasticsearch组合找到大量用例,由于能够实时检测和应对异常或威胁。
3、为何选择Elasticsearch?
最后进入百万美圆的问题,为何要优先使用Elasticsearch?让咱们看看最完美地回答这个问题的最重要因素:
1.可扩展性
使用Elasticsearch的主要优点之一是其可伸缩性。在大多数状况下,只需花费至关长的搜索时间,您就能够将数据索引到Elasticsearch中。是的,没错,在处理Elasticsearch的分布式特性时不会遇到麻烦或痛苦。Elasticsearch自行处理缩放。例如,若是将一个新节点添加到集群中,则无需设置路由,也无需进行重大的关键设置更改便可使其可发现并正常运行,Elasticsearch的主节点只需不多的干预便可解决此问题。 。
2.模式少
经过设计,Elasticsearch被设计为无模式的应用程序。这意味着咱们无需事先提供用于将文档放入Elasticsearch的架构。当涉及多个数据源时,这确实是一个巨大的缓解。在相似MongoDb的相似NoSQL数据库中,咱们须要预先指定架构。在Elasticsearch中,咱们能够对此部分感到叹为观止,而后就能够开始为数据创建索引了。若是没有模式,Elasticsearch会自动为文档字段分配一个模式。
3.定制
这个问题的另外一个响亮答案,为何是Elasticsearch?是它在其提供的解决方案中提供的自定义选项。例如,如前一节所述,它为开发人员提供的搜索选项的自定义可使搜索的几乎全部用例都包含在内。此外,Elasticsearch的数据通讯部分也能够经过多种方式完成,包括默认的插件,插件或用户开发的解决方案,能够与之完美集成。
4.社区
最后但并不是最不重要的一点是,由Shay Banon和其余一样才华横溢的开发人员领导的使人惊叹的社区使其成为强大的开源社区之一。社区的努力建立了许多插件,插件和库,从简单的分析器插件到数据河实现。快速的响应式论坛和活跃的在线状态也将节省大量开发时间。
4、结论
在本文中,我介绍了Elasticsearch,其要解决的问题和问题以及拥有Elasticsearch的使人信服的缘由。在该系列的下一篇文章中,我将向您简要介绍Elasticsearch堆栈以及每一个组件的功能。
关于如何搭建Elasticsearch,搭建能够看这篇网络