Milvus和Faiss都是高性能向量检索库,可让你在海量向量库中快速检索到和目标向量最类似的若干个向量,这里类似度量标准能够是内积或者欧式距离等。这里借用milvus官方的话再次说明这两个库的特色:html
Milvus 是一款开源的、针对海量特征向量的类似性搜索引擎。基于异构众核计算框架设计,成本更低,性能更好。 在有限的计算资源下,十亿向量搜索仅毫秒响应。java
说白了就是速度快,暂且不说十亿向量,本身写代码去完成对100万300维向量的余弦类似度计算并排序就须要不小的响应时间吧,就本人测试而言,即使使用scipy库计算速度依然要比milvus和faiss慢不少。python
本文主要内容分为三块:linux
在milvus开源以前,也存在高性能向量类似性搜索引擎(库),这个引擎就是Facebook的Faiss,功能都是同样的,具体能够参考官网 。c++
就我我的而言,我是推荐使用milvus的,主要是在我我的看来,milvus有以下几个好处:git
固然Faiss也并不是一无可取,首先速度并不输于Milvus,并且使用起来更方便,不须要使用docker,代码写起来更为简洁(后面章节会有示例代码,你们看了就知道faiss比较简洁了),且有大厂作技术支持,若是部署环境就是python,Faiss也是一个很好的选择。github
milvus 一共有两种安装方式:本身编译安装和使用docker安装。这里推荐你们使用docker安装,docker安装方便快捷,可在Windows上使用。本身编译安装,因为每一个人环境不一样,很容易出问题。本文只介绍基于docker的安装,另外由于我比较穷,因此只介绍cpu版本的安装,不过gpu安装也是大同小异。docker
首先就是要安装docker,还不了解docker能够了解一波,很是好用的虚拟机工具,强力推荐真是太香了,直接去Docker官网下载对应平台的安装文件便可。数据库
安装好docker后,要去pull对应的镜像(image),首先进到dockerhub官网,而后搜索milvus,第一个结果就是。由于咱们安装的是CPU版本,因此在tags里找cpu-latest,而后pull下来就能够了,即在你的命令行窗口输入
docker pull milvusdb/milvus:cpu-latest
。注意:随着版本迭代更新,这一条命令在将来可能会失效,建议先去dockerhub搜索一下,去看一下应该用什么tag。
pull
好以后, 在docker images
看一下应该会有该镜像,整个流程记录以下图:
编程
在建立启动容器以前,咱们要先设置配置文件。
在/home/$USER/milvus/conf 目录下建立 server_config.yaml 文件,而后将 server config 文件 的内容复制到你建立的配置文件中。
通常状况下 server_config.yaml文件不须要再修改,若是有我的配置需求,可根据官网教程进行修改。
而后就须要配置工做目录了,一共须要创建三个文件夹,在/home/$USER/milvus/目录下创建db,logs和wal文件夹。
注意上述目录都可根据本身需求进行修改,只是在启动docker服务是必定要映射到对的目录上!为了方便演示,我举个本身的目录例子,个人工做目录是C:\Users\Zhdun\milvus
,个人目录结构是:
milvus │ ├─conf //配置文件目录 │ server_config.yaml //配置文件 搜索引擎配置都在这里修改 │ ├─db //数据库存储目录 你的索引与向量存储的位置 │ └─logs //日志存储目录 │ └─wal // 预写式日志相关配置
设置好工做目录后,就可使用镜像建立容器了,以我本身工做目录为例,须要以下命令
docker run -td --name mymilvus -e "TZ=Asia/Shanghai" -p 19530:19530 -p 19121:19121 -v C:\Users\Zhdun\milvus\db:/var/lib/milvus/db -v C:\Users\Zhdun\milvus\conf:/var/lib/milvus/conf -v C:\Users\Zhdun\milvus\logs:/var/lib/milvus/logs -v C:\Users\Zhdun\milvus\wal:/var/lib/milvus/wal milvusdb/milvus:cpu-latest
命令看起来有点长, 我稍微解释下,-td是后台运行,--name是给本身的容器起个名字,-p是端口映射,不想用默认的话,能够去服务器配置文件里改,-v就是为了映射三个工做目录。具体能够参考docker的run命令。
执行完命令后,运行docker ps -a,若是发现本身建立的容器Exited的了,那就说明报错了,那就docker logs <container id>
一下,看出了什么问题。若是发现容器在运行了,就表明基本没问题了。
正常启动记录以下截图:
接下来我会说一下常见的安装问题。
Config check fail: Invalid config version: . Expected config version: 0.1 遇到这种问题就在服务器的配置文件第一行加上version: 0.1
。
Config check fail: Invalid cpu cache capacity: 1. Possible reason: sum of cache_config.cpu_cache_capacity and db_config.insert_buffer_size exceeds system memory.
这种问题就说明内存超出了限制,首先检查服务器配置里的 cpu_cache_capacity 和 insert_buffer_size 是否是过大了。
而后再检查给定docker设定的内存是多少,能够经过docker info来检查。
安装完成后,终于能够开始使用milvus了,milvus支持python,java和c++。在这里我只介绍python的使用。
首先安装 pymilvus库:pip install pymilvus
,而后就可使用这个库来写代码了,接下来我会直接把本身写的范例代码贴上去,其中每一步的具体含义以及可能的扩展我会直接在注释里告诉你们,若有错误还请各位指出。
# -*- coding: utf-8 -*- # 导入相应的包 import numpy as np from milvus import Milvus, MetricType # 初始化一个Milvus类,之后全部的操做都是经过milvus来的 milvus = Milvus(host='localhost', port='19530') # 向量个数 num_vec = 5000 # 向量维度 vec_dim = 768 # name collection_name = "test_collection" # 建立collection,可理解为mongo的collection collection_param = { 'collection_name': collection_name, 'dimension': vec_dim, 'index_file_size': 32, 'metric_type': MetricType.IP # 使用内积做为度量值 } milvus.create_collection(collection_param) # 随机生成一批向量数据 # 支持ndarray,也支持list vectors_array = np.random.rand(num_vec, vec_dim) # 把向量添加到刚才创建的collection中 status, ids = milvus.insert(collection_name=collection_name, records=vectors_array) # 返回 状态和这一组向量的ID milvus.flush([collection_name]) # 输出统计信息 print(milvus.get_collection_stats(collection_name)) # 建立查询向量 query_vec_array = np.random.rand(1, vec_dim) # 进行查询, status, results = milvus.search(collection_name=collection_name, query_records=query_vec_array, top_k=5) print(status) print(results) # 若是不用能够删掉 status = milvus.drop_collection(collection_name) # 断开、关闭链接 milvus.close()
这里也推荐下官方示例代码,写的很好,更加权威,可借鉴学习。
faiss有三种安装方式:
1 源码编译安装
根据官方教程来。作好踩坑的准备,这个能写好多,我就不写了,遇到问题私聊我吧
2 conda 安装
最为简单,可是须要conda。
# CPU version only conda install faiss-cpu -c pytorch # GPU version conda install faiss-gpu cudatoolkit=8.0 -c pytorch # For CUDA8 conda install faiss-gpu cudatoolkit=9.0 -c pytorch # For CUDA9 conda install faiss-gpu cudatoolkit=10.0 -c pytorch # For CUDA10
3 第三方预编译库
有热心网友本身预编译了,能够直接pip install,私人编译,非官方,稳定性和成功率不保证,我本身用过没啥问题,详见https://pypi.org/project/faiss/
最后的最后,血和泪的教训,环境必定要安装openblas,注意不是blas,是openblas,那否则多核利用率会变得极差
就像使用milvus同样,一样提供一份范例代码加以详细的注释,若有错误还请指正!
# 导入库 import numpy as np import faiss # 向量个数 num_vec = 5000 # 向量维度 vec_dim = 768 # 搜索topk topk = 10 # 随机生成一批向量数据 vectors = np.random.rand(num_vec, vec_dim) # 建立索引 faiss_index = faiss.IndexFlatL2(vec_dim) # 使用欧式距离做为度量 # 添加数据 faiss_index.add(vectors) # 查询向量 假设有5个 query_vectors = np.random.rand(5, vec_dim) # 搜索结果 # 分别是 每条记录对应topk的距离和索引 # ndarray类型 。shape:len(query_vectors)*topk res_distance, res_index = faiss_index.search(query_vectors, topk) print(res_index) print(res_distance)
代码是为了抛砖引玉,大概介绍使用流程,高阶用法能够去看官网wiki。
最后感谢各位阅读, 但愿能帮到大家.
文章能够转载, 但请注明出处: