Milvus实战 | 轻松搭建以图搜图系统

当您听到“以图搜图”时,是否首先想到了百度、Google 等搜索引擎的以图搜图功能呢?事实上,您彻底能够搭建一个属于本身的以图搜图系统:本身创建图片库;本身选择一张图片到库中进行搜索,并获得与其类似的若干图片。git

Milvus 做为一款针对海量特征向量的类似性检索引擎,旨在助力分析日益庞大的非结构化数据,挖掘其背后蕴含的巨大价值。为了让 Milvus 可以应用于类似图片检索的场景,咱们基于 Milvus 和图片特征提取模型 VGG 设计了一个以图搜图系统。github

正文分为数据准备、系统概览、 VGG 模型、API 介绍、镜像构建、系统部署、界面展现七个部分。数据准备章节介绍以图搜图系统的数据支持状况。系统概览章节展现系统的总体架构。VGG 模型章节介绍了 VGG 的结构、特色、块结构以及权重参数。API 介绍章节介绍系统的五个基础功能 API 的工做原理。镜像构建章节介绍如何经过源代码构建客户端和服务器端的 docker 镜像。系统部署章节展现如何三步搭建系统。界面展现章节会展现系统的搜索界面。web

 

1. 数据准备

本文以 PASCAL VOC 图片集为例搭建了一个以图搜图的端到端解决方案,该图片集包含 17,125 张图片,涵盖 20 个目录:人类;动物(鸟、猫、牛、狗、马、羊);交通工具(飞机、自行车、船、公共汽车、小轿车、摩托车、火车);室内(瓶子、椅子、餐桌、盆栽植物、沙发、电视)。算法

数据集大小:~2GBdocker

下载地址:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar浏览器

说明:您也可使用其余的图片数据进行加载。目前支持的图片格式有 .jpg 格式、 .png 格式。服务器

 

2. 系统概览

为了让用户在 web 网页上进行交互操做,咱们采起了 C/S 的架构。webclient 负责接收用户的请求并将请求发送给 webserver, webserver 接到 webclient 发来的 HTTP 请求以后进行运算并将运算结果返回给 webclient 。网络

webserver 主要由两部分组成,图片特征提取模型 VGG 和向量搜索引擎 Milvus。VGG 模型负责将图片转换成向量, Milvus 负责存储向量并进行类似向量检索。webserver 的架构以下图所示:架构

 

3. VGG 模型

VGGNet 由牛津大学的视觉几何组( Visual Geometry Group )和 Google DeepMind 公司的研究员共同提出,是 ILSVRC-2014 中定位任务第一名和分类任务第二名。其突出贡献在于证实使用很小的卷积( 3*3 ),增长网络深度能够有效提高模型的效果,并且 VGGNet 对其余数据集具备很好的泛化能力。VGG 模型在多个迁移学习任务中的表现要优于 GoogleNet ,从图像中提取 CNN 特征, VGG 模型是首选算法。所以,在本方案中选择 VGG 做为深度学习模型。app

VGGNet 探索了 CNN 的深度及其性能之间的关系,经过反复堆叠 3*3 的小型卷积核和 2*2 的最大池化层, VGGNet 成功地构筑了 16-19 层深的 CNN 。在本方案中使用了 Keras 的应用模块( keras.applications )提供的 VGG16 模型。

(1) VGG16 结构

VGG16 共包含 13个 卷积层( Convolutional Layer ), 3 个全链接层( Fully connected Layer ), 5 个池化层( Pool layer )。其中,卷积层和全链接层具备权重系数,所以也被称为权重层,总数目为 13+3=16 ,这便是 VGG16 中 16 的来源。(池化层不涉及权重,所以不属于权重层,不被计数)。

(2) VGG16 特色

  • 卷积层均采用相同的卷积核参数

  • 池化层均采用相同的池化核参数

  • 模型是由若干卷积层和池化层堆叠( stack )的方式构成,比较容易造成较深的网络结构

(3) VGG16 块结构

VGG16 的卷积层和池化层能够划分为不一样的块( Block ),从前到后依次编号为 Block1~Block5 。每个块内包含若干个卷积层和一个池化层。例如:Block2 包含 2 个卷积层( conv3-256 )和 1 个池化层( maxpool )。而且同一块内,卷积层的通道( channel )数是相同的。

根据下图给出的 VGG16 结构图, VGG16 的输入图像是 224x224x3 ,过程当中通道数翻倍,由 64 依次增长到 128 ,再到 256 ,直至 512 保持不变,再也不翻倍;高和宽变减半,由 224→112→56→28→14→7 。

(4) 权重参数

VGG 的结构简单,可是所包含的权重数目却很大,达到了 139,357,544 个参数。这些参数包括卷积核权重全链接层权重。所以它具备很高的拟合能力。

 

4. API 介绍

整个系统的 webserver 提供了 train 、process 、count、search 、delete 五个 API ,用户能够进行图片加载、加载进度查询、Milvus 的向量条数查询、图片检索、Milvus 表删除。这五个 API 涵盖了以图搜图系统的所有基础功能,下面会对每一个基础功能进行介绍。

(1) train

train API 的参数以下表所示:

methods name type
POST File string

在进行类似图片检索以前,须要将图片库加载进 Milvus,此时调用 train API 将图片的路径传入系统。由于 Milvus 仅支持向量数据的检索,故而须要将图片转化为特征向量,转化过程主要利用 Python 调用 VGG 模型来实现:

from preprocessor.vggnet import VGGNet
norm_feat = model.vgg_extract_feat(img_path)

当获取到图片的特征向量以后,再将这些向量利用 Milvus 的 insert_vectors 的接口导入 Milvus 里面:

from indexer.index import milvus_client, insert_vectors
status, ids = insert_vectors(index_client, table_name, vectors)

将这些特征向量导入 Milvus 以后,Milvus 会给每一个向量分配一个惟一的 id,为了后面检索时方便根据特征向量 id 查找其对应的图片,须要将每一个特征向量的 id 和其对应图片的关系保存起来:

from diskcache import Cache
for i in range(len(names)):
    cache[ids[i]] = names[i]

当调用 train API ,经过以上三步就将图片转成向量存入 Milvus 了。

(2) process

process API 的 methods 为 GET,调用时不须要传入其余参数。process API 能够查看图片加载的进度,调用以后会看到已经加载转化的图片数和传入路径下的总图片数。

(3) count

count API 的 methods 为 POST,调用时也不须要传入其余参数。count API 能够查看当前 Milvus 里的向量总数,每一条向量都是由一张图片转化而来。

(4) search

search API 的参数以下表所示:

methods Num file
POST topk (int) image file

当你选择好一张图片进行类似图片检索时,就能够调用 search API。当把待搜索的图片传入系统时,首先仍是调用 VGG 模型将图片转化为向量:

from preprocessor.vggnet import VGGNet
norm_feat = model.vgg_extract_feat(img_path)

获得待搜索图片的向量以后,再调用 Milvus 的 search_vectors 的接口进行类似向量检索:

from milvus import Milvus, IndexType, MetricType, Status
status, results = client.search_vectors(table_name=table_name, query_records=vectors, top_k=top_k, nprobe=16)

搜索出与目标向量类似的向量 id 以后,再根据先前存储的向量 id 和图片名称的对应关系检索出对应的图片名称:

from diskcache import Cache
def query_name_from_ids(vids):
    res = []
    cache = Cache(default_cache_dir)
    for i in vids:
        if i in cache:
            res.append(cache[i])
    return res

当调用 search API ,经过以上三步就能够将与目标图片类似的图片搜索出来了。

(5) delete

delete API 的 methods 为 POST,调用时不须要传入其余参数。delete API 会删除 Milvus 里面的表,清空之前导入的向量数据。

 

5. 镜像构建

(1) 构建 pic-search-webserver 镜像

首先拉取 Milvus bootcamp 的代码,而后利用咱们提供的 Dockerfile 构建镜像:

$ git clone https://github.com/milvus-io/bootcamp.git
$ cd bootcamp/solutions/pic_search/webserver
# 构建镜像
$ docker build -t pic-search-webserver .
# 查看生成的镜像
$ docker images | grep pic-search-webserver

经过上述步骤就能够构建好 webserver 的 docker 镜像。固然,你也能够直接使用咱们上传到 dockerhub 的镜像:

$ docker pull milvusbootcamp/pic-search-webserver:0.1.0

(2) 构建 pic-search-webclient 镜像

首先拉取 Milvus bootcamp 的代码,而后利用咱们提供的 Dockerfile 构建镜像:

$ git clone https://github.com/milvus-io/bootcamp.git
$ cd bootcamp/solutions/pic_search/webclient
# 构建镜像
$ docker build -t pic-search-webclient .
# 查看生成的镜像
$ docker images | grep pic-search-webclient

经过上述步骤就能够构建好 webclient 的 docker 镜像。固然,你也能够直接使用咱们上传到 dockerhub 的镜像:

$ docker pull milvusbootcamp/pic-search-webclient:0.1.0

 

6. 系统部署

咱们提供了 GPU 部署方案和 CPU 部署方案,用户能够自行选择。详细的部署流程能够参考连接:

https://github.com/milvus-io/bootcamp/blob/0.6.0/solutions/pic_search/README.md

Step 1 启动 Milvus Docker

详细步骤能够参考连接:

https://milvus.io/cn/docs/v0.6.0/guides/get_started/install_milvus/install_milvus.md

Step 2 启动 pic-search-webserver docker

$ docker run -d --name zilliz_search_images_demo \
-v IMAGE_PATH1:/tmp/pic1 \
-v IMAGE_PATH2:/tmp/pic2 \
-p 35000:5000 \
-e "DATA_PATH=/tmp/images-data" \
-e "MILVUS_HOST=192.168.1.123" \
milvusbootcamp/pic-search-webserver:0.1.0

Step 3 启动 pic-search-webclient docker

$ docker run --name zilliz_search_images_demo_web \
-d --rm -p 8001:80 \
-e API_URL=http://192.168.1.123:35000 \
milvusbootcamp/pic-search-webclient:0.1.0

整个以图搜图系统只需三步就能够部署好了。

 

7. 界面展现

按照上述流程部署完成以后,在浏览器中输入 " localhost:8001 " 就能够访问以图搜图界面了。

在路径框中填入图片路径进行加载,等待图片所有转换成向量并加载到 Milvus以后就能够进行图片检索了:

 

结语

本文利用 Milvus 和 VGG 搭建起了以图搜图系统,展现了 Milvus 在非结构化数据处理中的应用。Milvus 向量类似度检索引擎能够兼容各类深度学习平台,搜索十亿向量仅毫秒响应。您可使用 Milvus 探索更多 AI 用法!

更多关于VGG模型的信息请浏览:

VGG 官方网站:

http://www.robots.ox.ac.uk/~vgg/research/very_deep/

VGG Github:

https://github.com/machrisaa/tensorflow-vgg

 

| 欢迎加入 Milvus 社区

milvusio.slack.com | Slack 社区

zhihu.com/org/zilliz-11/columns | 知乎

zilliz.blog.csdn.net | CSDN 博客

相关文章
相关标签/搜索