Milvus实战 | 轻松搭建以图搜图系统

当您听到“以图搜图”时，是否首先想到了百度、Google 等搜索引擎的以图搜图功能呢？事实上，您彻底能够搭建一个属于本身的以图搜图系统：本身创建图片库；本身选择一张图片到库中进行搜索，并获得与其类似的若干图片。git

Milvus 做为一款针对海量特征向量的类似性检索引擎，旨在助力分析日益庞大的非结构化数据，挖掘其背后蕴含的巨大价值。为了让 Milvus 可以应用于类似图片检索的场景，咱们基于 Milvus 和图片特征提取模型 VGG 设计了一个以图搜图系统。github

正文分为数据准备、系统概览、 VGG 模型、API 介绍、镜像构建、系统部署、界面展现七个部分。数据准备章节介绍以图搜图系统的数据支持状况。系统概览章节展现系统的总体架构。VGG 模型章节介绍了 VGG 的结构、特色、块结构以及权重参数。API 介绍章节介绍系统的五个基础功能 API 的工做原理。镜像构建章节介绍如何经过源代码构建客户端和服务器端的 docker 镜像。系统部署章节展现如何三步搭建系统。界面展现章节会展现系统的搜索界面。web

1. 数据准备

本文以 PASCAL VOC 图片集为例搭建了一个以图搜图的端到端解决方案，该图片集包含 17,125 张图片，涵盖 20 个目录：人类；动物（鸟、猫、牛、狗、马、羊）；交通工具（飞机、自行车、船、公共汽车、小轿车、摩托车、火车）；室内（瓶子、椅子、餐桌、盆栽植物、沙发、电视）。算法

数据集大小：~2GBdocker

下载地址：http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar浏览器

说明：您也可使用其余的图片数据进行加载。目前支持的图片格式有 .jpg 格式、 .png 格式。服务器

2. 系统概览

为了让用户在 web 网页上进行交互操做，咱们采起了 C/S 的架构。webclient 负责接收用户的请求并将请求发送给 webserver， webserver 接到 webclient 发来的 HTTP 请求以后进行运算并将运算结果返回给 webclient 。网络

webserver 主要由两部分组成，图片特征提取模型 VGG 和向量搜索引擎 Milvus。VGG 模型负责将图片转换成向量， Milvus 负责存储向量并进行类似向量检索。webserver 的架构以下图所示：架构

3. VGG 模型

VGGNet 由牛津大学的视觉几何组（ Visual Geometry Group ）和 Google DeepMind 公司的研究员共同提出，是 ILSVRC-2014 中定位任务第一名和分类任务第二名。其突出贡献在于证实使用很小的卷积（ 3*3 ），增长网络深度能够有效提高模型的效果，并且 VGGNet 对其余数据集具备很好的泛化能力。VGG 模型在多个迁移学习任务中的表现要优于 GoogleNet ，从图像中提取 CNN 特征， VGG 模型是首选算法。所以，在本方案中选择 VGG 做为深度学习模型。app

VGGNet 探索了 CNN 的深度及其性能之间的关系，经过反复堆叠 3*3 的小型卷积核和 2*2 的最大池化层， VGGNet 成功地构筑了 16-19 层深的 CNN 。在本方案中使用了 Keras 的应用模块（ keras.applications ）提供的 VGG16 模型。

(1) VGG16 结构

VGG16 共包含 13个 卷积层（ Convolutional Layer ）， 3 个全链接层（ Fully connected Layer ）， 5 个池化层（ Pool layer ）。其中，卷积层和全链接层具备权重系数，所以也被称为权重层，总数目为 13+3=16 ，这便是 VGG16 中 16 的来源。(池化层不涉及权重，所以不属于权重层，不被计数)。

(2) VGG16 特色

卷积层均采用相同的卷积核参数
池化层均采用相同的池化核参数
模型是由若干卷积层和池化层堆叠（ stack ）的方式构成，比较容易造成较深的网络结构

(3) VGG16 块结构

VGG16 的卷积层和池化层能够划分为不一样的块( Block )，从前到后依次编号为 Block1~Block5 。每个块内包含若干个卷积层和一个池化层。例如：Block2 包含 2 个卷积层（ conv3-256 ）和 1 个池化层( maxpool )。而且同一块内，卷积层的通道（ channel ）数是相同的。

根据下图给出的 VGG16 结构图， VGG16 的输入图像是 224x224x3 ，过程当中通道数翻倍，由 64 依次增长到 128 ，再到 256 ，直至 512 保持不变，再也不翻倍；高和宽变减半，由 224→112→56→28→14→7 。

(4) 权重参数

VGG 的结构简单，可是所包含的权重数目却很大，达到了 139,357,544 个参数。这些参数包括卷积核权重和全链接层权重。所以它具备很高的拟合能力。

4. API 介绍

整个系统的 webserver 提供了 train 、process 、count、search 、delete 五个 API ，用户能够进行图片加载、加载进度查询、Milvus 的向量条数查询、图片检索、Milvus 表删除。这五个 API 涵盖了以图搜图系统的所有基础功能，下面会对每一个基础功能进行介绍。

(1) train

train API 的参数以下表所示：

methods	name	type
POST	File	string

在进行类似图片检索以前，须要将图片库加载进 Milvus，此时调用 train API 将图片的路径传入系统。由于 Milvus 仅支持向量数据的检索，故而须要将图片转化为特征向量，转化过程主要利用 Python 调用 VGG 模型来实现：

from preprocessor.vggnet import VGGNet
norm_feat = model.vgg_extract_feat(img_path)

当获取到图片的特征向量以后，再将这些向量利用 Milvus 的 insert_vectors 的接口导入 Milvus 里面:

from indexer.index import milvus_client, insert_vectors
status, ids = insert_vectors(index_client, table_name, vectors)

将这些特征向量导入 Milvus 以后，Milvus 会给每一个向量分配一个惟一的 id，为了后面检索时方便根据特征向量 id 查找其对应的图片，须要将每一个特征向量的 id 和其对应图片的关系保存起来：

from diskcache import Cache
for i in range(len(names)):
    cache[ids[i]] = names[i]

当调用 train API ，经过以上三步就将图片转成向量存入 Milvus 了。

(2) process

process API 的 methods 为 GET，调用时不须要传入其余参数。process API 能够查看图片加载的进度，调用以后会看到已经加载转化的图片数和传入路径下的总图片数。

(3) count

count API 的 methods 为 POST，调用时也不须要传入其余参数。count API 能够查看当前 Milvus 里的向量总数，每一条向量都是由一张图片转化而来。

(4) search

search API 的参数以下表所示：

methods	Num	file
POST	topk (int)	image file

当你选择好一张图片进行类似图片检索时，就能够调用 search API。当把待搜索的图片传入系统时，首先仍是调用 VGG 模型将图片转化为向量：

from preprocessor.vggnet import VGGNet
norm_feat = model.vgg_extract_feat(img_path)

获得待搜索图片的向量以后，再调用 Milvus 的 search_vectors 的接口进行类似向量检索：

from milvus import Milvus, IndexType, MetricType, Status
status, results = client.search_vectors(table_name=table_name, query_records=vectors, top_k=top_k, nprobe=16)

搜索出与目标向量类似的向量 id 以后，再根据先前存储的向量 id 和图片名称的对应关系检索出对应的图片名称：

from diskcache import Cache
def query_name_from_ids(vids):
    res = []
    cache = Cache(default_cache_dir)
    for i in vids:
        if i in cache:
            res.append(cache[i])
    return res

当调用 search API ，经过以上三步就能够将与目标图片类似的图片搜索出来了。

(5) delete

delete API 的 methods 为 POST，调用时不须要传入其余参数。delete API 会删除 Milvus 里面的表，清空之前导入的向量数据。

5. 镜像构建

(1) 构建 pic-search-webserver 镜像

首先拉取 Milvus bootcamp 的代码，而后利用咱们提供的 Dockerfile 构建镜像：

$ git clone https://github.com/milvus-io/bootcamp.git
$ cd bootcamp/solutions/pic_search/webserver
# 构建镜像
$ docker build -t pic-search-webserver .
# 查看生成的镜像
$ docker images | grep pic-search-webserver

经过上述步骤就能够构建好 webserver 的 docker 镜像。固然，你也能够直接使用咱们上传到 dockerhub 的镜像：

$ docker pull milvusbootcamp/pic-search-webserver:0.1.0

(2) 构建 pic-search-webclient 镜像

首先拉取 Milvus bootcamp 的代码，而后利用咱们提供的 Dockerfile 构建镜像：

$ git clone https://github.com/milvus-io/bootcamp.git
$ cd bootcamp/solutions/pic_search/webclient
# 构建镜像
$ docker build -t pic-search-webclient .
# 查看生成的镜像
$ docker images | grep pic-search-webclient

经过上述步骤就能够构建好 webclient 的 docker 镜像。固然，你也能够直接使用咱们上传到 dockerhub 的镜像：

$ docker pull milvusbootcamp/pic-search-webclient:0.1.0

6. 系统部署

咱们提供了 GPU 部署方案和 CPU 部署方案，用户能够自行选择。详细的部署流程能够参考连接：

https://github.com/milvus-io/bootcamp/blob/0.6.0/solutions/pic_search/README.md

Step 1 启动 Milvus Docker

详细步骤能够参考连接：

https://milvus.io/cn/docs/v0.6.0/guides/get_started/install_milvus/install_milvus.md

Step 2 启动 pic-search-webserver docker

$ docker run -d --name zilliz_search_images_demo \
-v IMAGE_PATH1:/tmp/pic1 \
-v IMAGE_PATH2:/tmp/pic2 \
-p 35000:5000 \
-e "DATA_PATH=/tmp/images-data" \
-e "MILVUS_HOST=192.168.1.123" \
milvusbootcamp/pic-search-webserver:0.1.0

Step 3 启动 pic-search-webclient docker

$ docker run --name zilliz_search_images_demo_web \
-d --rm -p 8001:80 \
-e API_URL=http://192.168.1.123:35000 \
milvusbootcamp/pic-search-webclient:0.1.0

整个以图搜图系统只需三步就能够部署好了。

7. 界面展现

按照上述流程部署完成以后，在浏览器中输入 " localhost:8001 " 就能够访问以图搜图界面了。

在路径框中填入图片路径进行加载，等待图片所有转换成向量并加载到 Milvus以后就能够进行图片检索了：

结语

本文利用 Milvus 和 VGG 搭建起了以图搜图系统，展现了 Milvus 在非结构化数据处理中的应用。Milvus 向量类似度检索引擎能够兼容各类深度学习平台，搜索十亿向量仅毫秒响应。您可使用 Milvus 探索更多 AI 用法！

更多关于VGG模型的信息请浏览：

VGG 官方网站：

http://www.robots.ox.ac.uk/~vgg/research/very_deep/

VGG Github：

https://github.com/machrisaa/tensorflow-vgg

| 欢迎加入 Milvus 社区

milvusio.slack.com | Slack 社区

zhihu.com/org/zilliz-11/columns | 知乎

zilliz.blog.csdn.net | CSDN 博客