LIRE教程之源码分析 | LIRE Tutorial of Analysis of the Source Code

时间 2019-11-20

标签 lire 教程源码分析 tutorial analysis source code 繁體版

原文原文链接

LIRE教程之源码分析 |LIRE Tutorial of Analysis of the Source Code

最近在作地理图像识别和检索的研究，发现了一个很好用的框架LIRE，遂研究了一通。网上的教程不算不少，并且LIRE更新比较快，一些方法已经更新或废弃，故想写几篇文章从新总结一下框架内的多种方法，方便他人使用。
LIRE(Lucene Image Retrieval)是一个开源的轻量级图像识别Java框架，提供了多种简单易用的图片检索方法。事实上，LIRE是基于Lucene这个全文检索引擎修改的，也沿用了该检索引擎的思路。
LIRE相关资料：
官网首页：http://www.lire-project.net/
下载地址：http://www.itec.uni-klu.ac.at/~mlux/lire-release/
Github：https://github.com/dermotte/LIRE
官方文档：https://github.com/dermotte/LIRE/blob/master/src/main/docs/developer-docs/docs/index.md
官方教程：http://www.semanticmetadata.net/wiki/
在进入正文以前，再推荐一下DaveBobo的博客，做者已经总结了很多方法，能够参考：https://blog.csdn.net/davebobo/article/category/6466512
在下载LIRE以后，同时也要确保Lucene相关的jar包没有缺失。java

接下来进入正题。本文的内容是结合官方给出的Sample Application，完成图片的提取特征、索引生成、图片检索。下载地址：[LIRE Sample Application]
git

笔者使用的是Intellij Idea。首先导入工程。从左边的文件夹中，能够发现LIRE的class都在net.semanticmetadata.lire这个文件夹中，而官方给出的案例则在net.semanticmetada.sampleapplication中。
github

图片特征提取和索引生成

打开案例中的Index.java文件(Github)，点击右上角的三角，修改Idea的配置文件，输入图片文件夹的路径。

运行，等待程序结束后发现右边文件夹多出了一个index文件。app

事实上，这个程序是最基本的索引文件。其步骤是:框架

(1) 读取输入文件夹下全部的照片文件。源码分析

(2) 设置提取图片要素的方法和descriptors。ui

(3) 对图片进行特征提取并写入索引。.net

其中，重点在于图片特征的提取方法。根据源码，能够发现首先创建了一个GlobalFeatureBuilder。这至关于图片提取的容器，再设置了图片提取要素的方法，在这段源码中包括CEDD,FCTH,AutoColorCorrelogram这三种方法。事实上，除了这些方法以外，还能够参考lib/net.semanticmetadata.lire/imageanalysis/features/global这个文件夹下的其余类，这个文件夹下包括了LIRE中包含的全局要素提取方法。code

GlobalDocumentBuilder globalDocumentBuilder = new GlobalDocumentBuilder(false, false);
globalDocumentBuilder.addExtractor(CEDD.class);
globalDocumentBuilder.addExtractor(FCTH.class);
globalDocumentBuilder.addExtractor(AutoColorCorrelogram.class);

接下来，只要使用GlobalDocumentBuilder.createDocument()方法就能够完成图片的特征提取。提取以后还须要创建索引，从而方便以后的图片检索。LIRE是创建在Lucene的基础上的，经过Lucene能够很是快速创建文档及其索引。新建一个IndexWriter，并将图片的特征写入其中。具体代码是下面这一段：blog

BufferedImage img = ImageIO.read(new FileInputStream(imageFilePath));
Document document = globalDocumentBuilder.createDocument(img, imageFilePath);
iw.addDocument(document);

即从本地上读取图片，再进行图片的特征提取，最后生成索引文件。

图片检索

在完成图片的特征提取以后，下一步是进行图片的检索，即给定一张图片，找出与这张图片最类似的图片。
打开案例中的Searcher.java文件(Github)。修改Idea配置文件，传入给定图片的路径。
运行以后能够发现输出了一串从小到大的分数及其具体的图片路径。分数越小说明该图片与给定图片越类似。若是分数为0说明二者同样。

这个程序是最基本的检索文件。其步骤是：

(1) 读取给定的图片。

(2) 读取以前生成的图片索引，寻找与给定图片最类似的图片。

(3) 输出类似度分数及具体的图片。

根据源码，能够发现使用了IndexReader读取了索引文件，以前是使用IndexWriter将这些索引文件写入了硬盘。

IndexReader ir = DirectoryReader.open(FSDirectory.open(Paths.get("index")));

接下来使用了ImageSearcher.search()方法寻找最类似的图片。其方法是使用CEDD方法对给定的图片进行特征提取，以后在索引中进行搜索。在这段代码中，返回与给定图片最类似的30张图片。ImageSearchHits即为最类似的图片，能够从中获取类似度分数和图片路径等。

ImageSearcher searcher = new GenericFastImageSearcher(30, CEDD.class);
ImageSearchHits hits = searcher.search(img, ir);

以上构成了一个完整的图片特征提取-生成索引-图片检索步骤，使用这两份代码已经知足基础的使用了。