人脸识别之insightface开源代码使用——自定义数据集制做

人脸识别简介

简单来说,人脸识别这个问题,就是给定两我的脸,而后断定他们是否是同一我的,这是它最原始的定义。它有不少应用场景,好比银行柜台、海关、手机解锁、酒店入住、网吧认证,会查身份证跟你是否是同一我的。html

关于人脸识别的内容,网上资料不少,这里推荐一篇综述,详细介绍了一些人脸识别的背景和目前的相关研究,以及经常使用的人脸识别模型:python

http://www.elecfans.com/d/709424.htmlgit

好了,直接进入主题,今天的重点:github

insightface论文:https://arxiv.org/abs/1801.07698算法

insightface github项目:https://github.com/deepinsight/insightfacevim

制做数据集

1、环境配置

官方提供的项目是基于mxnet框架的服务器

所以首先须要配置好这些环境,这里假设已经安装好cuda等app

mxnet的安装相对来讲比较简单(相对于caffe)框架

(1)查询本身cuda的版本dom

# 输入
nvcc -V
# 输出结果
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2017 NVIDIA Corporation
Built on Fri_Sep__1_21:08:03_CDT_2017
Cuda compilation tools, release 9.0, V9.0.176复制代码

(2)用pip安装mxnet(GPU版本)

pip install mxnet-cu90
# 根据自身状况查询对应的安装命令,例如我服务器的cuda版本是10.0的,安装命令为 pip install mxnet-cu100复制代码

2、克隆项目和数据集下载

将insight项目克隆到本地

git clone --recursive https://github.com/deepinsight/insightface.git复制代码

下载lfw数据集

连接:http://vis-www.cs.umass.edu/lfw/index.html#download

这里为了方便,提供了lfw的部分用于练手

练手数据集https://www.lanzous.com/i7gdxva,仅用于制做数据集练手

观察数据集:file这里提供了20个用于练手,完整数据集能够去上面的连接或自行查找下载。

说明:每一个文件夹名为人的姓名,文件夹内包含多张人脸(>=1)。

file

3、开始制做所须要格式的数据集

(1)数据对齐并生成lst文件

将lfw数据集下载好并放置在datasets下(这里以lfwdata命名的文件夹),而后新建一个文件夹并命名为output保存对齐后的人脸图片,新建一个文件夹命名为train用于保存输出结果

运行insightface项目下 src/align下的align_lfw.py文件

python align_lfw.py --input-dir ../../datasets/lfwdata --output-dir ../../datasets/output复制代码

对齐后的图片file

遇到问题1:

ValueError: Object arrays cannot be loaded when allow_pickle=False

解决方案:

pip3 install numpy==1.16.1

若是已安装了多个numpy版本,须要先将其卸载后在运行

遇到问题2:

AttributeError: module 'scipy.misc' has no attribute 'imread'

解决方案:

pip install scipy==1.1.0

若是成功运行,output文件夹下会产生对齐后的人脸以及一个lst文件(将lst文件更名为 train.lst,并移动到train文件下)

终端下,移动和重命名的操做

# 重命名 mv [原始文件名] [改变后的文件名] 
mv lst train.lst
# 移动 mv [起始文件路径] [目标文件路径]
mv train.lst ../train/复制代码

观察生成的 lst 文件内容:

1       ../../datasets/train/Abbas_Kiarostami/Abbas_Kiarostami_0001.jpg 0
1       ../../datasets/train/Abdel_Aziz_Al-Hakim/Abdel_Aziz_Al-Hakim_0001.jpg   1
# 其中1表明对齐,最后的数字0,1表明class label 中间是地址;须要用\t表示tab键,不能用空格间隔。复制代码

(2)建立property配置文件

在datasets/train下建立property,没有后缀

写入下面内容,含义1000,112,112表明ID数量,尺寸,尺寸

1000,112,112复制代码

(3)生成rec&idx文件(依托于lst文件)

运行src/data face2rec2.py

python face2rec2.py ../../datasets/train/复制代码

运行可能会报错,须要修改,可能缘由是源代码是基于python2的

在python3下运行,修改第105行成以下所示:

s = mx.recordio.pack(header, b'')复制代码

运行成功后会出现两个文件

train.idx和train.rec复制代码

(4)建立pair文件

为了作测试咱们须要生成验证集用的bin文件,bin文件生成前须要作pair文件,就是一对一对的数据,每一行分别是

图A的目录 空格 图B的目录 空格 标志0/1(表明两张图类别一致否)
在src/data下新建一个代码generate_image_pairs.py用于生成pairs复制代码

代码来源:https://blog.csdn.net/CLOUD_J/article/details/100672392

# coding:utf-8
import sys
import os
import random
import time
import itertools
import pdb
import argparse
#src = '../../datasets/lfw2'
#dst = open('../../datasets/lfw/train.txt', 'a')
parser = argparse.ArgumentParser(description='generate image pairs')
# general
parser.add_argument('--data-dir', default='', help='')
parser.add_argument('--outputtxt', default='', help='path to save.')
parser.add_argument('--num-samepairs',default=100)
args = parser.parse_args()
cnt = 0
same_list = []
diff_list = []
list1 = []
list2 = []
folders_1 = os.listdir(args.data_dir)
dst = open(args.outputtxt, 'a')
count = 0
dst.writelines('\n')
# 产生相同的图像对
for folder in folders_1:
    sublist = []
    same_list = []
    imgs = os.listdir(os.path.join(args.data_dir, folder))
    for img in imgs:
        img_root_path = os.path.join(args.data_dir, folder, img)
        sublist.append(img_root_path)
        list1.append(img_root_path)
    for item in itertools.combinations(sublist, 2):
        for name in item:
            same_list.append(name)
    if len(same_list) > 10 and len(same_list) < 13:
        for j in range(0, len(same_list), 2):
                if count < int(args.num_samepairs):#数量能够修改
                    dst.writelines(same_list[j] + ' ' + same_list[j+1]+ ' ' + '1' + '\n')
                    count += 1
    if count >= int(args.num_samepairs):
        break
list2 = list1.copy()
# 产生不一样的图像对
diff = 0
print(count)
# 若是不一样的图像对远远小于相同的图像对,则继续重复产生,直到二者相差很小
while True:
    random.seed(time.time() * 100000 % 10000)
    random.shuffle(list2)
    for p in range(0, len(list2) - 1, 2):
        if list2[p] != list2[p + 1]:
            dst.writelines(list2[p] + ' ' + list2[p + 1] + ' ' + '0'+ '\n')
            diff += 1
            if diff >= count:
                break
            #print(diff)
    if diff < count:
        #print('--')
        continue
    else:
        break复制代码

运行generateimagepairs.py

python3 generate_image_pairs.py --data-dir ../../datasets/output --outputtxt ../../datasets/train/train.txt --num-samepairs 5复制代码

--data-dir 后接对齐后的人脸

--outputtxt 用于保存train.txt文件

--num-samepairs 生成多少对(具体如何设置,还须要好好研究一下)

运行成功后在datasets/train下会生成一个train.txt文件

内容:

../../datasets/output/Abdullah/Abdullah_0002.jpg ../../datasets/output/Abdullah/Abdullah_0004.jpg 1
# 前面两个分布是生成的pairs的路径,后面的0/1表明是否同一我的或类复制代码

(5)生成验证集bin文件

成功后利用/src/data/下的 lfw2pack.py生成bin文件

可是存在点问题,对lfw2pack.py进行稍微的修改,修改lfw2pack.py中19行,打#的为更改的,改成两个参数,一个是txt读出来的列表,另外一个是总数量。

import mxnet as mx
from mxnet import ndarray as nd
import argparse
import pickle
import sys
import os
sys.path.append(os.path.join(os.path.dirname(__file__), '..', 'eval'))
import lfw
parser = argparse.ArgumentParser(description='Package LFW images')
# general
parser.add_argument('--data-dir', default='', help='')
# 修改1:图像大小修改成112,112
parser.add_argument('--image-size', type=str, default='112,112', help='')
parser.add_argument('--output', default='', help='path to save.')
# 修改2:添加解析参数 
parser.add_argument('--num-samepairs',default=100)
args = parser.parse_args()
lfw_dir = args.data_dir
image_size = [int(x) for x in args.image_size.split(',')]
# 修改3:将文件名pairs.txt修改为train.txt
lfw_pairs = lfw.read_pairs(os.path.join(lfw_dir, 'train.txt'))
print(lfw_pairs)
# 修改4:下一行进行修改为须要的格式
# lfw_paths, issame_list = lfw.get_paths(lfw_dir, lfw_pairs, 'jpg')
lfw_paths, issame_list = lfw.get_paths(lfw_pairs,int(args.num_samepairs)+1)#, 'jpg')
lfw_bins = []
#lfw_data = nd.empty((len(lfw_paths), 3, image_size[0], image_size[1]))
print(len(issame_list))
i = 0
for path in lfw_paths:
  with open(path, 'rb') as fin:
    _bin = fin.read()
    lfw_bins.append(_bin)
    #img = mx.image.imdecode(_bin)
    #img = nd.transpose(img, axes=(2, 0, 1))
    #lfw_data[i][:] = img
    i+=1
    if i%1000==0:
      print('loading lfw', i)
with open(args.output, 'wb') as f:
  pickle.dump((lfw_bins, issame_list), f, protocol=pickle.HIGHEST_PROTOCOL)复制代码

对应的get_paths这个文件存在src/eval/lfw.py下,把它也改了

def get_paths(pairs, same_pairs):
    nrof_skipped_pairs = 0
    path_list = []
    issame_list = []
    cnt = 1
    for pair in pairs:
      path0 = pair[0]
      path1 = pair[1]
      if cnt < same_pairs:
        issame = True
      else:
        issame = False 
      if os.path.exists(path0) and os.path.exists(path1):    # Only add the pair if both paths exist
        path_list += (path0,path1)
        issame_list.append(issame)
      else:
        print('not exists', path0, path1)
        nrof_skipped_pairs += 1
      cnt += 1
    if nrof_skipped_pairs>0:
        print('Skipped %d image pairs' % nrof_skipped_pairs)
    return path_list, issame_list复制代码

vim中多行注释方法:

多行注释:
1. 进入命令行模式,按ctrl + v进入 visual block模式,而后按j, 或者k选中多行,把须要注释的行标记起来
2. 按大写字母I,再插入注释符,例如 #
3. 按esc键就会所有注释了
取消多行注释:
1. 进入命令行模式,按ctrl + v进入 visual block模式,按字母l横向选中列的个数,例如 # 须要选中2列
2. 按字母j,或者k选中注释符号
3. 按d键就可所有取消注释复制代码

以后再运行

python3 lfw2pack.py --data-dir ../../datasets/train --output ../../datasets/train/lfw.bin --num-samepairs 2复制代码

注意:我这里报错了(没有报错的小伙伴能够忽略)`path0 = pair[0]IndexError: list index out of range`

仔细分析以后,是由于在train.txt中存在空白行致使,直接删除便可,若是没有报错能够直接忽略

至此,咱们已经完成了数据集的制做,后续会更新如何训练,以及使用。

这部份内容,是本人摸索了好久才搞定的,本文尽量的写的详细,但愿能帮到你们,写这篇的时候又从新操做了一遍,若是能够恳请小伙伴们能点个“在看”或分享到朋友圈。谢谢啦!

欢迎关注我,wx公主号:AI算法与图像处理

相关文章
相关标签/搜索