在Learning OpenCV书中,讲到一个基础数据类型CvMat,其中有一段程序:
1 Example 3-9. Summing all of the elements in a three-channel matrix 2 float sum( const CvMat* mat ) { 3 4 float s = 0.0f; 5 for(int row=0; rowrows; row++ ) { 6 const float* ptr = (const float*)(mat->data.ptr + row * mat->step);//获取第row行的首地址 7 for( col=0; col cols; col++ ) { 8 s += *ptr++; 9 } 10 } 11 return( s ); 12 }
不知是我理解错了,还是书中的注释错了,“Summing all of the elements in a three-channel matrix”,我觉得是对三通道CvMat中的所有数据进行求和,按我之前的编写风格,这个函数应该是这样:
Example 3-9. Summing all of the elements in a three-channel matrix float sum( const CvMat* mat ) { float s = 0.0f; float* ptr=(float*) cvPtr2D(mat, 0, 0); //获取该三通道CvMat的首地址(这一句未经测试),将三通道看成是二通道 for(int row=0; rowrows; row++ ) { for( col=0; col cols; col++ ) { s += *ptr+*(ptr+1)+*(ptr+2);//将整个CvMat看成一个二维矩阵,则矩阵中每个元素是个三维向量,将它们累加 ptr += 3;//通道为3,则自加3可到达CvMat矩阵中的下个元素 } } return( s ); }
自己构建一个三通道矩阵,为测试方便,假设其为一个3*3的三通道矩阵:
( 1, 2, 3) (11, 12, 13) (21, 22, 23) (31, 32, 33) (41, 42, 43) (51, 52, 53) (61, 62, 63) (71, 72, 73) (81, 82, 83) //用代码构建如下 CvMat* mat = cvCreateMat(3,3,CV_32FC3);//矩阵元素为三通道浮点数 cvZero(mat);//将矩阵置0 //----------为矩阵元素赋值----------------- //获得矩阵元素(0,0)的指针 float *p = (float*)cvPtr2D(mat, 0, 0); //为矩阵赋值 for(int i = 0; i < 9; i++) { //为每个通道赋值 *p = (float)i*10; p++; *p = (float)i*10+1; p++; *p = (float)i*10+2; p++; }
经过测试,书中的程序得到的结果是279,即如下数的和:
--------------- |( 1, 2, 3) | (11, 12, 13) (21, 22, 23) |(31, 32, 33) | (41, 42, 43) (51, 52, 53) |(61, 62, 63) | (71, 72, 73) (81, 82, 83) ---------------
即仅仅求了一个3*3 float矩阵的值,严格的说是矩阵中每行第一个元素的三通道元素和。
我们可以对其进行进一步剖析,先看CvMat的申明:
1 typedef struct CvMat 2 { 3 int type; 4 int step; 5 int* refcount; 6 union 7 { 8 uchar* ptr; 9 short* s; 10 int* i; 11 float* fl; 12 double* db; 13 } data; 14 #ifdef __cplusplus 15 union 16 { 17 int rows; 18 int height; 19 }; 20 union 21 { 22 int cols; 23 int width; 24 }; 25 #else 26 int rows; 27 int cols; 28 #endif 29 } CvMat;
在大多数情况下,你需要使用最有效率的方式来访问矩阵中的数据。如果使用函数界面来访问数据,效率比较低,你应该使用指针方式来直接访问矩阵中数据。特别是,如果你想遍历矩阵中所有元素时,就更需要这样做了。
在用指针直接访问矩阵元素时,就需要格外注意矩阵结构体中的step成员。该成员是以字节为单位的每行的长度。而矩阵结构体的cols或width就不适合此时使用,因为为了访问效率,矩阵中的内存分配上,是以每四个字节做为最小单位的。因此如果一个矩阵的宽度是三个字节,那么就会在宽度上分配四个字节,而此时每行最后一个字节会被忽略掉。所以我们用step则会准确地按行访问数据。 我们可以通过以下例子,看一下rows,cols,height,width,step的数据,你可以通过改变矩阵的元素类型定义,来查看step的改变:1 #pragma comment(lib,"cxcore.lib") 2 #include"cv.h" 3 #include4 void main() 5 { 6 //矩阵元素为三通道8位浮点数 7 CvMat *mat=cvCreateMat(3,3,CV_32FC3 ); 8 printf("rows=%d,cols=%d,height=%d,width=%d,step=%d\n",mat->rows,mat->cols,mat->height,mat->width,mat->step); 9 10 }
//输出为rows=3,cols=3,height=3,width=3,step=36
如果我们的矩阵存储的是浮点型(或整数类型)数据,此时矩阵中每个元素占4字节,则如果我们用float类型指针指向下一行时,我们实际上要用float类型指针挪动step/4的长度,因为float类型指针每挪动一个单位就是4个字节长度。
如果我们的矩阵存储的是double类型数据,此时矩阵中每个元素占8字节,则如果我们用double类型指针指向下一行时,我们实际上要用double类型指针挪动step/8的长度,因为double类型指针每挪动一个单位就是8个字节长度。 在书上源码中:const float* ptr = (const float*)(mat->data.ptr + row * mat->step);//获取第row行的首地址
这里只是获得一个首地址而已,然后在结下来的循环里,它仅仅累加了mat->cols,并不正确,应该改为:
1 for(int row=0; rowrows; row++ ) { 2 const float* ptr = (const float*)(mat->data.ptr + row * mat->step);//获取第row行的首地址 3 for( col=0; col cols; col++ ) { 4 s += *ptr+*(ptr+1)+*(ptr+2); 5 ptr += 3; 6 } 7 } 8 return( s ); 9 }