Какова структура памяти OpenCV cvMat? - PullRequest
14 голосов
/ 11 ноября 2009

Представьте, что у меня есть следующее:

CvMat* mat = cvCreateMat(3,3,CV_16SC3)

Это матрица 3x3 целых чисел канала 3.

Теперь, если вы посмотрите документацию OpenCV, вы найдете следующее в качестве замедления для cvMat:

typedef struct CvMat {

int type;
int step;

int* refcount;

union
{
    uchar* ptr;
    short* s;
    int* i;
    float* fl;
    double* db;
} data;

union
{
    int rows;
    int height;
};

union
{
    int cols;
    int width;
};
} CvMat;

Теперь я хочу поиграться с data.ptr, который является указателем на данные, хранящиеся в cvMat. Тем не менее, мне трудно понять, как устроена память. Если у меня есть 3-канальная матрица, как это работает? Для одного канала это просто, потому что это просто простая матрица MxN, где M - строки, а N - столбцы. Однако для 3 канала, есть 3 из эти матрицы MxN ?? Может кто-нибудь показать мне, как мне начать инициализацию трехканальной матрицы через data.ptr и как получить доступ к этим значениям, пожалуйста? Спасибо.

1 Ответ

19 голосов
/ 11 ноября 2009

Эта веб-страница является отличным введением в OpenCV 1.1. Я бы рекомендовал использовать последнюю версию, Open CV 2.0 , которая имеет общий класс Mat, который обрабатывает изображения, матрицы и т. Д. В отличие от OpenCV 1.1.

На приведенной выше веб-странице подробно описаны следующие методы доступа к элементам в многоканальных изображениях:

Косвенный доступ: (общий, но неэффективный доступ к изображению любого типа)

Для многоканального плавающего (или байтового) изображения:

IplImage* img=cvCreateImage(cvSize(640,480),IPL_DEPTH_32F,3);
CvScalar s;
s=cvGet2D(img,i,j); // get the (i,j) pixel value
printf("B=%f, G=%f, R=%f\n",s.val[0],s.val[1],s.val[2]);
s.val[0]=111;
s.val[1]=111;
s.val[2]=111;
cvSet2D(img,i,j,s); // set the (i,j) pixel value

Прямой доступ: (эффективный доступ, но подвержен ошибкам) ​​

Для многоканального плавающего изображения:

IplImage* img=cvCreateImage(cvSize(640,480),IPL_DEPTH_32F,3);
((float *)(img->imageData + i*img->widthStep))[j*img->nChannels + 0]=111; // B
((float *)(img->imageData + i*img->widthStep))[j*img->nChannels + 1]=112; // G
((float *)(img->imageData + i*img->widthStep))[j*img->nChannels + 2]=113; // R

Прямой доступ с помощью указателя: (Упрощенный и эффективный доступ при ограниченных допущениях)

Для многоканального плавающего изображения (при условии 4-байтового выравнивания):

IplImage* img  = cvCreateImage(cvSize(640,480),IPL_DEPTH_32F,3);
int height     = img->height;
int width      = img->width;
int step       = img->widthStep/sizeof(float);
int channels   = img->nChannels;
float * data    = (float *)img->imageData;
data[i*step+j*channels+k] = 111;

Прямой доступ с помощью оболочки C ++: (простой и эффективный доступ)

Определение оболочки с ++ для одноканальных байтовых изображений, многоканальных байтовых изображений и многоканальных плавающих изображений:

template<class T> class Image
  {
    private:
    IplImage* imgp;
    public:
    Image(IplImage* img=0) {imgp=img;}
    ~Image(){imgp=0;}
    void operator=(IplImage* img) {imgp=img;}
    inline T* operator[](const int rowIndx) {
      return ((T *)(imgp->imageData + rowIndx*imgp->widthStep));}
  };

  typedef struct{
    unsigned char b,g,r;
  } RgbPixel;

  typedef struct{
    float b,g,r;
  } RgbPixelFloat;

  typedef Image<RgbPixel>       RgbImage;
  typedef Image<RgbPixelFloat>  RgbImageFloat;
  typedef Image<unsigned char>  BwImage;
  typedef Image<float>          BwImageFloat;

Для многоканального плавающего изображения:

IplImage* img=cvCreateImage(cvSize(640,480),IPL_DEPTH_32F,3);
RgbImageFloat imgA(img);
imgA[i][j].b = 111;
imgA[i][j].g = 111;
imgA[i][j].r = 111;
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...