记录一下Faiss在项目使用中的一些优化,对OMP_NUM_THREADS 环境变量参数的测试验证~python
OMP_NUM_THREADS 用于控制线程并发数. 测试条件:单个循环请求,持续时间大于15m; 基础数据:200w 软件环境:docker; ubuntu 16.04 ;python2.7; faiss:1.4.0-cpu 检索服务功能: (汉明距离计算 + 欧式距离计算 )
测试总结以下: * CPU=1 & OMP_NUM_THREADS=1时, - 1m,5m,15m load average 分布为 31.54,41.16,43.43; - CPUs(%) 用户空间占比:32.1;内核空间占比:2.4;空闲占比:65.2; - faiss 检索耗时大约在5-6ms左右; - 检索服务总体响应时间较平稳,大部分在12ms左右; * CPU=3 & OMP_NUM_THREADS=1时, - 1m,5m,15m load average 分布为 49.17,48.70,50.54; - CPUs(%) 用户空间占比:39.5;内核空间占比:4.2;空闲占比:30.3; - faiss 检索耗时大约在5-7ms左右; - 检索服务总体响应时间较平稳,大部分耗时在12ms左右; * CPU=3 & OMP_NUM_THREADS=10时, - 1m,5m,15m load average 分布为 41.33,43.90,55.87; - CPUs(%) 用户空间占比:20.7;内核空间占比:2.3;空闲占比:58.0; - faiss 检索耗时不稳定,抖动较大, 大约在10-90ms左右; - 检索服务总体响应时间存在抖动,大约在14-92ms左右; * CPU=1 & OMP_NUM_THREADS=10时, - 1m,5m,15m load average 分布为 67.77,61.89,61.07; - CPUs(%) 用户空间占比:20.6;内核空间占比:2.9;空闲占比:18.2; - faiss 检索耗时不稳定,抖动较大, 大约在5-80ms左右; - 检索服务总体响应时间存在抖动,大约在13-99ms左右; 最终结论: a: OMP_NUM_THREADS=1时,faiss检索耗时较稳定; b: OMP_NUM_THREADS=10时,faiss检索耗时不稳定,抖动较大; b: OMP_NUM_THREADS=1时, 多核CPU相较于单核CPU,负载略高,利用率略高,空闲占比较低; c: OMP_NUM_THREADS=10时, 多核CPU相较于单核CPU,负载较低,利用率较低,空闲占比较高; d: 优化方向:OMP_NUM_THREADS=1 + 多进程