Проблема с записью рамки изображения YUV в C / C ++ - PullRequest
3 голосов
/ 25 марта 2012

Я пытаюсь преобразовать кадр RGB, который взят из OpenGL glReadPixels (), в кадр YUV и записать кадр YUV в файл (.yuv).Позже я хотел бы записать его в named_pipe в качестве входных данных для FFMPEG, но сейчас я просто хочу записать его в файл и просмотреть результат изображения с помощью YUV Image Viewer.Так что просто не обращайте внимания на «запись в трубу».

После запуска кода я обнаружил следующие ошибки:

  1. Количество кадров, отображаемых в программе просмотра изображений YUV, всегда составляет 1/3 от количества кадров.Я объявил в моей программе.Когда я объявляю fps как 10, я мог видеть только 3 кадра.Когда я объявил fps как 30, я мог видеть только 10 кадров.Однако, когда я просматриваю файл в текстовом редакторе, я вижу, что в файле напечатано правильное количество слова «FRAME».Вот пример вывода, который я получил: http://www.bobdanani.net/image.yuv

  2. Я не мог видеть правильное изображение, но только некоторые искаженные зеленые, синие, желтые и черные пиксели.

Я читал о формате YUV из http://wiki.multimedia.cx/index.php?title=YUV4MPEG2 и http://www.fourcc.org/fccyvrgb.php#mikes_answer и http://kylecordes.com/2007/pipe-ffmpeg

Вот то, что я пробовал до сих пор.Я знаю, что этот конверсионный подход довольно неэффективен, и я могу оптимизировать его позже.Теперь я просто хочу, чтобы этот наивный подход работал и правильно отображал изображение.

int frameCounter = 1; 
int windowWidth = 0, windowHeight = 0;
unsigned char *yuvBuffer;
unsigned long bufferLength = 0;
unsigned long frameLength = 0;
int fps = 10;

void display(void) {

    /* clear the color buffers */
    glClear(GL_COLOR_BUFFER_BIT | GL_DEPTH_BUFFER_BIT);

    /* DRAW some OPENGL animation, i.e. cube, sphere, etc 
     .......
     .......
    */

    glutSwapBuffers();

    if ((frameCounter % fps) == 1){
        bufferLength = 0;
        windowWidth = glutGet(GLUT_WINDOW_WIDTH);
        windowHeight = glutGet (GLUT_WINDOW_HEIGHT);
        frameLength = (long) (windowWidth * windowHeight * 1.5 * fps) + 100; // YUV 420 length (width*height*1.5) + header length
        yuvBuffer = new unsigned char[frameLength];
        write_yuv_frame_header();
    }

    write_yuv_frame();

    frameCounter = (frameCounter % fps) + 1;

    if ( (frameCounter % fps) == 1){
        snprintf(filename, 100, "out/image-%d.yuv", seq_num);
        ofstream out(filename, ios::out | ios::binary); 
        if(!out) { 
            cout << "Cannot open file.\n"; 
        } 

        out.write (reinterpret_cast<char*> (yuvBuffer), bufferLength);
        out.close();
        bufferLength = 0;
        delete[] yuvBuffer;
    }
}


void write_yuv_frame_header (){
    char *yuvHeader = new char[100];
    sprintf (yuvHeader, "YUV4MPEG2 W%d H%d F%d:1 Ip A0:0 C420mpeg2 XYSCSS=420MPEG2\n", windowWidth, windowHeight, fps);
    memcpy ((char*)yuvBuffer + bufferLength, yuvHeader, strlen(yuvHeader));
    bufferLength += strlen (yuvHeader);
    delete (yuvHeader);
}

void write_yuv_frame() {
    int width = glutGet(GLUT_WINDOW_WIDTH);
    int height = glutGet(GLUT_WINDOW_HEIGHT);
    memcpy ((void*) (yuvBuffer+bufferLength), (void*) "FRAME\n", 6);
    bufferLength +=6;

    long length = windowWidth * windowHeight;
    long yuv420FrameLength = (float)length * 1.5;
    long lengthRGB = length * 3;
    unsigned char *rgb      = (unsigned char *) malloc(lengthRGB * sizeof(unsigned char));
    unsigned char *yuvdest  = (unsigned char *) malloc(yuv420FrameLength * sizeof(unsigned char));
    glReadPixels(0, 0, windowWidth, windowHeight, GL_RGB, GL_UNSIGNED_BYTE, rgb);

    int r, g, b, y, u, v, ypos, upos, vpos;

    for (int j = 0; j <  windowHeight; ++j){
        for (int i = 0; i < windowWidth; ++i){
            r = (int)rgb[(j * windowWidth + i) * 3 + 0];
            g = (int)rgb[(j * windowWidth + i) * 3 + 1];
            b = (int)rgb[(j * windowWidth + i) * 3 + 2];

            y = (int)(r *  0.257 + g *  0.504 + b *  0.098) + 16;
            u = (int)(r *  0.439 + g * -0.368 + b *  -0.071) + 128;
            v = (int)(r *  -0.148 + g * -0.291 + b * 0.439 + 128);

            ypos = j * windowWidth + i;
            upos = (j/2) * (windowWidth/2) + i/2 + length;
            vpos = (j/2) * (windowWidth/2) + i/2 + length + length/4;

            yuvdest[ypos] = y;
            yuvdest[upos] = u;
            yuvdest[vpos] = v;            
        } 
    }

    memcpy ((void*) (yuvBuffer + bufferLength), (void*)yuvdest, yuv420FrameLength);
    bufferLength += yuv420FrameLength;
    free (yuvdest);   
    free (rgb);
}

Это всего лишь базовый подход, и позже я могу оптимизировать алгоритм преобразования.Может кто-нибудь сказать мне, что не так в моем подходе?Я предполагаю, что одна из проблем связана с вызовом outstream.write (), потому что я преобразовал данные без знака char * в данные char *, что может привести к потере точности данных.Но если я не приведу это к char *, я получу ошибку компиляции.Однако это не объясняет, почему выходные кадры повреждены (учитывают только 1/3 от общего числа кадров).

Ответы [ 2 ]

1 голос
/ 25 марта 2012

Мне кажется, что у вас слишком много байтов на кадр для данных 4: 2: 0.В соответствии со спецификацией, к которой вы привязаны, число байтов для кадра 4: 2: 0 200x200 пикселей должно составлять 200 * 200 * 3/2 = 60 000Но у вас есть ~ 90 000 байтов.Глядя на ваш код, я не вижу, куда вы конвертируете с 4: 4: 4 до 4: 2: 0.Таким образом, у вас есть 2 варианта: либо установить заголовок на 4: 4: 4, либо преобразовать данные YCbCr в 4: 2: 0 перед их записью.

0 голосов
/ 10 сентября 2014

Я скомпилировал ваш код и, несомненно, возникла проблема при вычислении значений upos и vpos.Для меня это сработало (от RGB до YUV NV12):

vpos = length + (windowWidth * (j/2)) + (i/2)*2;
upos = vpos + 1;
...