libavcodec, как перекодировать видео с разной частотой кадров? - PullRequest
5 голосов
/ 16 ноября 2010

Я получаю видеокадры с камеры через v4l, и мне нужно перекодировать их в формат mpeg4 для последовательной потоковой передачи через RTP.перекодирование: входной поток выдает 15 к / с, а выход - 25 к / с, и каждый входной кадр преобразуется в одну последовательность видеообъектов (я проверил это с помощью простой проверки выходного потока битов).Я предполагаю, что получатель правильно анализирует поток битов mpeg4, но пакетирование RTP как-то не так.Как я должен разделить закодированный поток битов в один или несколько AVPacket?Может быть, я упускаю очевидное, и мне просто нужно искать маркеры кадра B / P, но я думаю, что я не использую API кодирования правильно.

Вот выдержка из моего кода, которая основанана доступных образцах ffmpeg:

// input frame
AVFrame *picture;
// input frame color-space converted
AVFrame *planar;
// input format context, video4linux2
AVFormatContext *iFmtCtx;
// output codec context, mpeg4
AVCodecContext *oCtx;
// [ init everything ]
// ...
oCtx->time_base.num = 1;
oCtx->time_base.den = 25;
oCtx->gop_size = 10;
oCtx->max_b_frames = 1;
oCtx->bit_rate = 384000;
oCtx->pix_fmt = PIX_FMT_YUV420P;

for(;;)
{
  // read frame
  rdRes = av_read_frame( iFmtCtx, &pkt );
  if ( rdRes >= 0 && pkt.size > 0 )
  {
    // decode it
    iCdcCtx->reordered_opaque = pkt.pts;
    int decodeRes = avcodec_decode_video2( iCdcCtx, picture, &gotPicture, &pkt );
    if ( decodeRes >= 0 && gotPicture )
    {
      // scale / convert color space
      avpicture_fill((AVPicture *)planar, planarBuf.get(), oCtx->pix_fmt, oCtx->width, oCtx->height);
      sws_scale(sws, picture->data, picture->linesize, 0, iCdcCtx->height, planar->data, planar->linesize);
      // encode
      ByteArray encBuf( 65536 );
      int encSize = avcodec_encode_video( oCtx, encBuf.get(), encBuf.size(), planar );
      // this happens every GOP end
      while( encSize == 0 )
        encSize = avcodec_encode_video( oCtx, encBuf.get(), encBuf.size(), 0 );
      // send the transcoded bitstream with the result PTS
      if ( encSize > 0 )
        enqueueFrame( oCtx->coded_frame->pts, encBuf.get(), encSize );
    }
  }
}

1 Ответ

0 голосов
/ 29 июля 2011

Самое простое решение - использовать два потока. Первый поток будет делать все, что указано в вашем вопросе (декодирование, масштабирование / преобразование цветового пространства, кодирование). Частично перекодированные кадры будут записаны в промежуточную очередь, совместно используемую вторым потоком. Максимальная длина этой очереди будет в этом конкретном случае (преобразование из более низкой скорости передачи в бит) 1 кадр. Второй поток будет читать кадры цикла из входной очереди следующим образом:

void FpsConverter::ThreadProc()
{

timeBeginPeriod(1);
DWORD start_time = timeGetTime();
int frame_counter = 0;
while(!shouldFinish()) {
    Frame *frame = NULL;
    DWORD time_begin = timeGetTime();
    ReadInputFrame(frame);
    WriteToOutputQueue(frame);
    DWORD time_end = timeGetTime();
    DWORD next_frame_time = start_time + ++frame_counter * frame_time;
    DWORD time_to_sleep = next_frame_time - time_end;
    if (time_to_sleep > 0) {
        Sleep(time_to_sleep);
    }
}
timeEndPeriod(1);
}

Когда мощность процессора достаточна, а требуется более высокая точность и плавность, вы можете вычислить выходной кадр не только из одного кадра, но и из большего количества кадров путем некоторой интерполяции (аналогично методам, используемым в кодеках MPEG). Чем ближе временная метка выходного кадра к временной метке входного кадра, тем больший вес следует назначить этому конкретному входному кадру.

...