Elasticsearch是一个搜索引擎,创建在Lucene之上java
集群 (cluster)node
表明一个集群,集群中有多个节点,其中有一个为主节点,这个主节点是能够经过选举产生的,主从节点是对于集群内部来讲的。
es的一个概念就是去中心化,字面上理解就是无中心节点,这是对于集群外部来讲的,由于从外部来看es集群,在逻辑上是个总体,
你与任何一个节点的通讯和与整个es集群通讯是等价的。
节点(node)spring
每个运行实例称为一个节点,每个运行实例既能够在同一机器上,也能够在不一样的机器上.所谓运行实例,就是一个服务器进程.
在测试环境内,能够在一台服务器上运行多个服务器进程,在生产环境建议每台服务器运行一个服务器进程
索引(index)sql
这里的索引是名词不是动词,在elasticsearch里面支持多个索引。相似于关系数据库里面每个服务器能够支持多个数据库同样。
在每一索引下面又支持多种类型,相似于关系数据库里面的一个数据库能够有多张表。可是本质上和关系数据库有很大的区别。
分片(shards) 数据库
把一个索引分解为多个小的索引,每个小的索引叫作分片。分片后就能够把各个分片分配到不一样的节点中,构成分布式搜索
分片的数量只能在索引建立前指定,而且索引建立后不能更改
副本(replicas)json
副本的做用一是提升系统的容错性,当个某个节点某个分片损坏或丢失时能够从副本中恢复。二是提升es的查询效率,es会自动对搜索请求进行负载均衡
recoveryapi
表明数据恢复或叫数据从新分布,es在有节点加入或退出时会根据机器的负载对索引分片进行从新分配,挂掉的节点从新启动时也会进行数据恢复。
river服务器
表明es的一个数据源,也是其它存储方式(如:数据库)同步数据到es的一个方法。它是以插件方式存在的一个es服务,经过读取river中的数据并把它索引到es中,
官方的river有couchDB的,RabbitMQ的,Twitter的,Wikipedia的,river这个功能将会在后面的文件中重点说到。
gatewayapp
表明es索引的持久化存储方式,es默认是先把索引存放到内存中,当内存满了时再持久化到硬盘。当这个es集群关闭再从新启动时就会从gateway中读取索引数据。
es支持多种类型的gateway,有本地文件系统(默认),分布式文件系统,Hadoop的HDFS和amazon的s3云存储服务。
---将各类集群状态信息、索引配置信息等所有持久存放在网关中
discovery.zen负载均衡
表明es的自动发现节点机制,es是一个基于p2p的系统,它先经过广播寻找存在的节点,再经过多播协议来进行节点之间的通讯,同时也支持点对点的交互。
Transport
表明es内部节点或集群与客户端的交互方式,默认内部是使用tcp协议进行交互,同时它支持http协议(json格式)、thrift、servlet、
memcached、zeroMQ等的传输协议(经过插件方式集成)。
索引(Index)
ElaticSearch将数据存放在一个或多个索引当中。一个索引至关于一个数据库,里面存放用户文档数据。在底层,ElasticSearch实际上仍是
使用Lucene完成读写数据的操做,ElasticSearch索引是由一个或多个Lucene索引组成,因此ES中的分片或副本实际上就是一个Lucene索引。
文档(Document)
文档是ES中主要的实体,全部ES的查询都是基于存放在ES中文档资源的查询。每一个文档都是由各类域(Field)组成,每一个域(Field)有一个名
称和一个或多个值构成。实际上,从用户的角度看,一个ES文档就是一个JSON对象。
映射(Mapping)
映射用于定义文档域的属性,这些属性包括分词器,字段类型,存储类型等。对于没有定义的字段类型的属性,ES能够自动经过其字段值进行识别。
类型(Type)
ES中每一个文档必须有一个类型定义。这里的类型至关于数据库当中的表,类型定义了字段映射(相似数据库表结构),
这样一来,每一个索引能够包含多种文档类型,而每种文档类型定义一种映射关系。
路由(Routing)
ES给每一个文档建索引后,经过路由能够算出所查的文档处在哪一个分片上,由于在创建索引之初使用公式:shard = hash(routting) % number_of_pr
imary_shards进行文档分配。routing值是一个任意的字符串,默认是文档的ID,经过人工指定就能够控制文档存放在哪一个shard的位置了。
索引别名(Index Alias)
索引别名至关于快捷方式或软连接,能够指向一个或多个索引,甚至能够指向带路由的分片。
近实时性 near realtime (nrt)
Elasticsearch是一个近实时性的搜索平台,因此对于刚建过的索引文件进行查询时须要一个轻微的等待时间(一般为1秒)。
java操做elastic:
<properties> <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding> <runSuite>**/MainTestSuite.class</runSuite> <elasticsearch.plugin.name>sql</elasticsearch.plugin.name> <elasticsearch.plugin.site>true</elasticsearch.plugin.site> <elasticsearch.plugin.jvm>true</elasticsearch.plugin.jvm> <elasticsearch.version>5.6.2</elasticsearch.version> <elasticsearch.rest.version>5.5.2</elasticsearch.rest.version> <slf4j.version>1.7.7</slf4j.version> <elasticsearch.plugin.classname>org.elasticsearch.plugin.nlpcn.SqlPlug</elasticsearch.plugin.classname> </properties> <repositories> <repository> <id>elasticsearch-releases</id> <url>https://artifacts.elastic.co/maven</url> <releases> <enabled>true</enabled> </releases> <snapshots> <enabled>false</enabled> </snapshots> </repository> </repositories> <dependencies> <dependency> <groupId>org.springframework</groupId> <artifactId>spring-core</artifactId> <version>4.0.2.RELEASE</version> </dependency> <dependency> <groupId>org.elasticsearch</groupId> <artifactId>elasticsearch</artifactId> <version>${elasticsearch.version}</version> <scope>provided</scope> </dependency> <dependency> <groupId>org.elasticsearch.client</groupId> <artifactId>transport</artifactId> <version>${elasticsearch.version}</version> <scope>provided</scope> </dependency> <dependency> <groupId>org.elasticsearch.client</groupId> <artifactId>rest</artifactId> <version>${elasticsearch.rest.version}</version> </dependency> <dependency> <groupId>org.elasticsearch.client</groupId> <artifactId>x-pack-transport</artifactId> <version>${elasticsearch.version}</version> </dependency> <dependency> <groupId>commons-io</groupId> <artifactId>commons-io</artifactId> <version>2.4</version> </dependency> <dependency> <groupId>com.google.guava</groupId> <artifactId>guava</artifactId> <version>15.0</version> </dependency> <dependency> <groupId>org.hamcrest</groupId> <artifactId>hamcrest-all</artifactId> <version>1.3</version> <scope>test</scope> </dependency> <dependency> <groupId>org.locationtech.spatial4j</groupId> <artifactId>spatial4j</artifactId> <version>0.6</version> </dependency> <dependency> <groupId>com.vividsolutions</groupId> <artifactId>jts</artifactId> <version>1.13</version> </dependency> <dependency> <groupId>com.alibaba</groupId> <artifactId>fastjson</artifactId> <version>1.1.41</version> <scope>test</scope> </dependency> <dependency> <groupId>com.alibaba</groupId> <artifactId>druid</artifactId> <version>1.0.15</version> </dependency> <!-- LOGGING begin --> <dependency> <groupId>org.slf4j</groupId> <artifactId>slf4j-api</artifactId> <version>${slf4j.version}</version> </dependency> <dependency> <groupId>org.slf4j</groupId> <artifactId>slf4j-log4j12</artifactId> <version>${slf4j.version}</version> </dependency> <!-- common-logging 实际调用slf4j --> <dependency> <groupId>org.slf4j</groupId> <artifactId>jcl-over-slf4j</artifactId> <version>${slf4j.version}</version> </dependency> <!-- java.util.logging 实际调用slf4j --> <dependency> <groupId>org.slf4j</groupId> <artifactId>jul-to-slf4j</artifactId> <version>${slf4j.version}</version> </dependency> <!-- LOGGING end --> <dependency> <groupId>javax.servlet</groupId> <artifactId>servlet-api</artifactId> <version>2.5</version> <scope>provided</scope> </dependency> <dependency> <groupId>junit</groupId> <artifactId>junit</artifactId> <version>4.12</version> <scope>test</scope> </dependency> </dependencies>
EsQuery
public class EsQuery { protected static Logger logger = LoggerFactory.getLogger(EsQuery.class); /** * 集群状态 */ public void clusterStatus(){ ClusterAdminClient clusterAdminClient = ElasticUtil.getClusterClient().admin().cluster(); ClusterHealthResponse healths = clusterAdminClient.prepareHealth().get(); String clusterName = healths.getClusterName(); int numberOfDataNodes = healths.getNumberOfDataNodes(); int numberOfNodes = healths.getNumberOfNodes(); ClusterHealthStatus status = healths.getStatus(); System.out.println("集群名称:"+clusterName); System.out.println("数据节点:"+numberOfDataNodes); System.out.println("正常节点:"+numberOfNodes); System.out.println("状态值:"+status.name()); } /** * 判断索引库是否存在 * @param indexName * @return */ public boolean isIndexExists(String indexName) { IndicesExistsRequest inExistsRequest = new IndicesExistsRequest(indexName); IndicesExistsResponse inExistsResponse = ElasticUtil.getClusterClient().admin().indices() .exists(inExistsRequest).actionGet(); return inExistsResponse.isExists(); } /** * 建立索引 indexName 索引名称 * @param indexName * @return * @throws IOException */ public boolean createIndex(String indexName){ if(isIndexExists(indexName)){ return false; } CreateIndexResponse response = ElasticUtil.getClusterClient().admin().indices().prepareCreate(indexName).execute().actionGet(); if(response.isAcknowledged()){ return true; } return false; } /** * 删除索引库 * @param indexName * @return */ public boolean dropIndex(String indexName) { if (!isIndexExists(indexName)) { return false; } else { DeleteIndexResponse dResponse = ElasticUtil.getClusterClient().admin().indices().prepareDelete(indexName).execute().actionGet(); if (dResponse.isAcknowledged()) { return true; }else{ return false; } } } /** * 采用standard分词器-默认*/ public boolean addType(String indexName,String typeName){ XContentBuilder builder=null; try { builder = XContentFactory.jsonBuilder() .startObject() .startObject(typeName) .endObject() .endObject(); } catch (IOException e) { e.printStackTrace(); } PutMappingRequest mappingRequest = Requests.putMappingRequest(indexName).type(typeName).source(builder); try { PutMappingResponse mappingResponse = ElasticUtil.getClusterClient().admin().indices().putMapping(mappingRequest).actionGet(); if (mappingResponse.isAcknowledged()) { return true; }else{ return false; } } catch (IndexNotFoundException e) { System.out.println("索引不存在,建立失败..."); } return false; } /** * 采用IK分词器 */ public boolean addIKType(String indexName,String typeName){ XContentBuilder builder=null; try { builder = XContentFactory.jsonBuilder() .startObject() .startObject(typeName) .startObject("properties") .startObject("poi_id").field("type","integer").endObject() .startObject("poi_title").field("type","text").field("analyzer","ik_max_word").endObject() .startObject("poi_address").field("type","text").field("analyzer","ik_max_word").endObject() .startObject("poi_tags").field("type","text").field("analyzer","ik_max_word").endObject() .startObject("poi_phone").field("type","text").endObject() .endObject() .endObject() .endObject(); } catch (IOException e) { e.printStackTrace(); } PutMappingRequest mappingRequest = Requests.putMappingRequest(indexName).type(typeName).source(builder); try { PutMappingResponse mappingResponse = ElasticUtil.getClusterClient().admin().indices().putMapping(mappingRequest).actionGet(); if (mappingResponse.isAcknowledged()) { return true; }else{ return false; } } catch (IndexNotFoundException e) { System.out.println("索引不存在,建立失败..."); } return false; } /** * 添加或修改数据 设置本身的id * @param id * @param json */ public static String insertOrUpdate(String indexName,String typeName,String id,Map<String, Object> json) { if(json==null){ return null; } IndexResponse response = ElasticUtil.getClusterClient().prepareIndex(indexName, typeName,id).setSource(json).execute().actionGet(); return response.getId(); } /** * 添加或修改数据 使用随机id * @param json */ public String insertOrUpdate(String indexName,String typeName,Map<String, Object> json) { if(json==null){ return null; } IndexResponse response = ElasticUtil.getClusterClient().prepareIndex(indexName, typeName).setSource(json).execute().actionGet(); return response.getId(); } /** * 经过id查询单条数据 * @param id * @return */ public GetResponse getResourceById(String indexName,String typeName,String id){ GetResponse response = ElasticUtil.getClusterClient().prepareGet(indexName,typeName, id).get(); //Map<String, Object> source = response.getSource(); return response; } /** * 删除数据 * @param id */ public void deleteResourceByIds(String indexName,String typeName,String[] ids) { if(ids==null||ids.length<1){ return; } for(String id :ids){ ElasticUtil.getClusterClient().prepareDelete(indexName, typeName, id) .execute().actionGet(); System.out.println("删除id: "+id); } System.out.println("delete over.."); } /** * 查询 index/type 数据 * @param indexName */ public static void simpleQuery(String indexName,String typeName){ SearchRequestBuilder prepareSearch = ElasticUtil.getClusterClient().prepareSearch(indexName); if(typeName!=null && !"".equals(typeName.trim())){ prepareSearch.setTypes(typeName); } // prepareSearch.setFrom(1).setSize(10); SearchResponse response = prepareSearch.execute().actionGet(); SearchHit[] searchHits = response.getHits().getHits(); for (SearchHit sh : searchHits) { System.out.println(sh.getId()+"==>"+sh.getSource()); } System.out.println("total==> "+searchHits.length); } /** * 经过field字段过滤索引库 * @param indexName * @param typeName * @param field * @param value */ public void matchFieldQuery(String indexName,String typeName,String field,String value){ QueryBuilder qb = QueryBuilders.matchQuery(field,value); SearchRequestBuilder requestBuilder = ElasticUtil.getClusterClient().prepareSearch(indexName); if(typeName!=null&&!"".equals(typeName.trim())){ requestBuilder.setTypes(typeName); } SearchResponse response = requestBuilder.setQuery(qb).execute().actionGet(); SearchHit[] searchHits = response.getHits().getHits(); for (SearchHit sh : searchHits) { System.out.println(sh.getId()+"==>"+sh.getSource()); } System.out.println("total==> "+searchHits.length); } /** * 经过多个field字段过滤索引库 * @param indexName * @param typeName * @param field1 * @param field2 * @param value */ public void multiFieldMatchQuery(String indexName,String typeName,String field1,String field2,String value){ QueryBuilder qb = QueryBuilders.multiMatchQuery(value,field1, field2); SearchRequestBuilder requestBuilder = ElasticUtil.getClusterClient().prepareSearch(indexName); if(typeName!=null&&!"".equals(typeName.trim())){ requestBuilder.setTypes(typeName); } SearchResponse response = requestBuilder.setQuery(qb) .execute().actionGet(); SearchHit[] searchHits = response.getHits().getHits(); for (SearchHit sh : searchHits) { System.out.println(sh.getId()+"==>"+sh.getSource()); } } /** * 经过id 获取多条数据*/ public void idsQuery(String indexName,String typeName,String[] ids){ IdsQueryBuilder qb = QueryBuilders.idsQuery().addIds(ids); SearchRequestBuilder requestBuilder = ElasticUtil.getClusterClient().prepareSearch(indexName); if(typeName!=null&&!"".equals(typeName.trim())){ requestBuilder.setTypes(typeName); } SearchResponse response = requestBuilder.setQuery(qb).execute().actionGet(); SearchHit[] searchHits = response.getHits().getHits(); for (SearchHit sh : searchHits) { System.out.println(sh.getId()+"==>"+sh.getSource()); } System.out.println("total==> "+searchHits.length); } }