首先仍是要感谢箫鸣朋友在我《OpenCV学习笔记(四十)——再谈OpenCV数据结构Mat详解》的留言,告诉我M.at<float>(3, 3)在Debug模式下运行缓慢,推荐我使用M.ptr<float>(i)此类方法。这不由勾起了我测试一下的冲动。下面就为你们奉上个人测试结果。数据结构
我这里测试了三种操做Mat数据的办法,套用流行词,普通青年,文艺青年,为啥第三种我不叫2b青年,你们慢慢日后看咯。函数
普通青年的操做的办法一般是M.at<float>(i, j)学习
文艺青年通常会走路线M.ptr<float>( i )[ j ]测试
暴力青年一般直接强制使用我第40讲提到的M.data这个指针spa
实验代码以下:.net
t = (double)getTickCount(); Mat img1(1000, 1000, CV_32F); for (int i=0; i<1000; i++) { for (int j=0; j<1000; j++) { img1.at<float>(i,j) = 3.2f; } } t = (double)getTickCount() - t; printf("in %gms\n", t*1000/getTickFrequency()); //*************************************************************** t = (double)getTickCount(); Mat img2(1000, 1000, CV_32F); for (int i=0; i<1000; i++) { for (int j=0; j<1000; j++) { img2.ptr<float>(i)[j] = 3.2f; } } t = (double)getTickCount() - t; printf("in %gms\n", t*1000/getTickFrequency()); //*************************************************************** t = (double)getTickCount(); Mat img3(1000, 1000, CV_32F); float* pData = (float*)img3.data; for (int i=0; i<1000; i++) { for (int j=0; j<1000; j++) { *(pData) = 3.2f; pData++; } } t = (double)getTickCount() - t; printf("in %gms\n", t*1000/getTickFrequency()); //*************************************************************** t = (double)getTickCount(); Mat img4(1000, 1000, CV_32F); for (int i=0; i<1000; i++) { for (int j=0; j<1000; j++) { ((float*)img3.data)[i*1000+j] = 3.2f; } } t = (double)getTickCount() - t; printf("in %gms\n", t*1000/getTickFrequency());
最后两招能够都当作是暴力青年的方法,由于反正都是指针的操做,局限了各暴力青年手段就不显得暴力了。指针
在Debug、Release模式下的测试结果分别为:code
Debug | Release | |
普通青年 | 139.06ms | 2.51ms |
文艺青年 | 66.28ms | 2.50ms |
暴力青年1 | 4.95ms | 2.28ms |
暴力青年2 | 5.11ms | 1.37ms |
根据测试结果,我以为箫铭说的是很可信的,普通青年的操做在Debug模式下果真缓慢,他推荐的文艺青年的路线确实有提升。值得注意的是原本后两种办法确实是一种比较2b青年的作法,由于at操做符或者ptr操做符,其实都是有内存检查的,防止操做越界的,而直接使用data这个指针确实很危险。不过从速度上确实让人眼前一亮,因此我不敢称这样的青年为2b,尊称为暴力青年吧。blog
不过在Release版本下,几种办法的速度差异就不明显啦,都是很普通的青年。因此若是你们最后发行程序的时候,能够不在乎这几种操做办法的,推荐前两种哦,都是很好的写法,操做指针的事仍是留给大神们用吧。就到这里吧~~内存
补充:箫铭又推荐了两种文艺青年的处理方案,我也随便测试了一下,先贴代码,再贴测试结果:
/*********增强版********/ t = (double)getTickCount(); Mat img5(1000, 1000, CV_32F); float *pData1; for (int i=0; i<1000; i++) { pData1=img5.ptr<float>(i); for (int j=0; j<1000; j++) { pData1[j] = 3.2f; } } t = (double)getTickCount() - t; printf("in %gms\n", t*1000/getTickFrequency()); /*******终极版*****/ t = (double)getTickCount(); Mat img6(1000, 1000, CV_32F); float *pData2; Size size=img6.size(); if(img2.isContinuous()) { size.width = size.width*size.height; size.height = 1; } size.width*=img2.channels(); for(int i=0; i<size.height; i++) { pData2 = img6.ptr<float>(i); for(int j=0; j<size.width; j++) { pData2[j] = saturate_cast<float>(3.2f); } } t = (double)getTickCount() - t; printf("in %gms\n", t*1000/getTickFrequency());
测试结果:
Debug | Release | |
增强版文艺青年 | 5.74ms | 2.43ms |
终极版文艺青年 | 40.12ms | 2.34ms |
个人测试结果感受这两种方案只是锦上添花的效果,也使你们的操做有了更多的选择,但感受在速度上并无数量级的提高,再次感谢箫铭对我blog的支持。后来箫铭说saturate_cast才把速度降下来,我很赞成,就不贴上去测试结果了。但我查看资料了解了一下saturate_cast的做用。能够当作是类型的强制转换,好比对于saturate_cast<uchar>来讲,就是把数据转换成8bit的0~255区间,负值变成0,大于255的变成255。若是是浮点型的数据,变成round最近的整数,仍是颇有用处的函数,推荐你们在须要的时候尝试。