通常做为独立的包进行导入,而且对其进行了大数据预览的优化和处理
做为一个独立Python模块进行导入,而且调取接口使用。
调用方法python
import elasticdb.es_sysdb as es esdb = es.Es()
举例:
打印出索引(表)内的全部数据:
须要index名,也就是指定索引名,在这里,假设我要查全部的monlog数据,那么查询语句以下:git
a = esdb.search_all(client=esdb.conn, index=monlog, type="doc") for i in a: c.append(i["_source"]["message"])
接口参数说明github
参数 必选 类型 说明 index ture str 索引名 ,可认为是数据库 type true str 索引类型,可认为是表名 keywords ture str 关键字 page ture str 页数,分页逻辑 size ture str 每页展现条数,分页逻辑使用
1 查询包含的关键字的日志(展现前10条)数据库
a = esdb.search_searchdoc(index=monlog, type="doc", keywords="cpu") for i in a: print i["_source"]["message"]
2 查询指定的索引下的数据,而且分页
示例:查询index为”oplog-2018-08,oplog-2018-12”,而且每页展现(size)5条,输出第二页(page)api
for i in esdb.serch_by_index(index="oplog-2018-08,oplog-2018-12", page=2, size=5)["hits"]["hits"]: print(i["_source"]["message"])
3 输出全部日志(输出所有)app
for i in esdb.search_all(client=esdb.conn, index="monlog-*", type="doc"): print i
4 输出去重后的日志(分页,带关键字)
示例:关键字为空,搜索monlog的全部数据,展现第一页,而且每页展现10条elasticsearch
for i in esdb.serch_es_count(keywords = "", index="monlog-*", type="doc",page=1, size=10): print i
5 删除指定索引的值
示例:删除monlog的全部值模块化
esdb.delete_all_index(index="monlog-*", type="doc")
6 查询集群健康状态大数据
esdb.check_health()
7 往索引中添加数据优化
body = {"name": 'lucy2', 'sex': 'female', 'age': 10} print esdb.insertDocument(index='demo', type='test', body=body)
8 获取指定index、type、id对应的数据
print esdb.getDocById(index='demo', type='test', id='6gsqT2ABSm0tVgi2UWls')
9 更新指定index、type、id所对应的数据
body = {"doc": {"name": 'jackaaa'}}#修改部分字段 print esdb.updateDocById('demo', 'test', 'z', body)
10 批量插入数据
_index = 'demo' _type = 'test_df' import pandas as pd frame = pd.DataFrame({'name': ['tomaaa', 'tombbb', 'tomccc'], 'sex': ['male', 'famale', 'famale'], 'age': [3, 6, 9], 'address': [u'合肥', u'芜湖', u'安徽']}) print esAction.insertDataFrame(_index, _type, frame)
from elasticsearch import Elasticsearch from elasticsearch import helpers class Es: def __init__(self): self.hosts = "127.0.0.1" self.conn = Elasticsearch(hosts=self.hosts, port=9200) def check(self): ''' 输出当前系统的ES信息 ''' return self.conn.info() def ping(self): return self.conn.ping() def check_health(self): ''' 检查集群的健康状态 :return: ''' status = self.conn.transport.perform_request('GET', '/_cluster/health', params=None)["status"] return statuu def get_index(self): return self.conn.indices.get_alias("*") def search_specify(self, index=None, type=None, keywords=None, page=None, size=None): # 查询包含的关键字的日志 query = { 'query': { 'match': { 'message': keywords } }, 'from':page * size, 'size':size } message = self.searchDoc(index, type, query) return message