3d реконструкция из 2 изображений без информации о камере - PullRequest
32 голосов
/ 27 января 2012

Я новичок в этой области, и я пытаюсь смоделировать простую сцену в 3D из двухмерных изображений, и у меня нет никакой информации о камерах.Я знаю, что есть 3 варианта :

  • У меня есть два изображения, и я знаю модель моей камеры (intrisics), которую я загрузил, например, из XML loadXMLFromFile() => stereoRectify() => reprojectImageTo3D()

  • У меня их нет, но я могу откалибровать камеру => stereoCalibrate() => stereoRectify() => reprojectImageTo3D()

  • Я не могу откалибровать камеру (это мой случай, потому что у меня нет камеры, которая сделала 2 изображения, тогда мне нужно найти пару ключевых точек на обоихизображения с SURF, например, SIFT (на самом деле я могу использовать любой детектор BLOB-объектов), затем вычислить дескрипторы этих ключевых точек, затем сопоставить ключевые точки из правого и левого изображений в соответствии с их дескрипторами, а затем найти из них фундаментальную матрицу.намного сложнее и будет выглядеть так:

    1. определение ключевых точек (SURF, SIFT) =>
    2. извлечение дескрипторов (SURF, SIFT) =>
    3. сравнение и сопоставлениедескрипторы (подходы BruteForce, Flann) =>
    4. найти фундаментальный мат (findFundamentalMat()) из этих пар =>
    5. stereoRectifyUncalibrated() =>
    6. reprojectImageTo3D()

Я использую последнийПодход и мои вопросы:

1) Это правильно?

2) если все в порядке, у меня есть сомнения по поводу последнего шага stereoRectifyUncalibrated() => reprojectImageTo3D().Сигнатура функции reprojectImageTo3D():

void reprojectImageTo3D(InputArray disparity, OutputArray _3dImage, InputArray Q, bool handleMissingValues=false, int depth=-1 )

cv::reprojectImageTo3D(imgDisparity8U, xyz, Q, true) (in my code)

Параметры:

  • disparity - Входной одноканальный 8-разрядный без знака, 16-разрядный со знаком, 32-разрядный32-разрядное изображение со знаком с плавающей запятой.
  • _3dImage - Вывод 3-канального изображения с плавающей точкой того же размера, что и disparity.Каждый элемент _3dImage(x,y) содержит трехмерные координаты точки (x,y), вычисленные по карте диспаратности.
  • Q - матрица преобразования перспективы 4x4, которую можно получить с помощью stereoRectify().
  • handleMissingValues - Указывает, должна ли функция обрабатывать пропущенные значения (т. Е. Точки, где расхождение не было вычислено).Если handleMissingValues=true, то пиксели с минимальным несоответствием, соответствующим выбросам (см. StereoBM::operator()), преобразуются в трехмерные точки с очень большим значением Z (в настоящее время установлено на 10000).
  • ddepth -Дополнительная глубина выходного массива.Если это -1, выходное изображение будет иметь CV_32F глубину.ddepth также можно установить на CV_16S, CV_32S или `CV_32F '.

Как я могу получить матрицу Q?Возможно ли получить матрицу Q с F, H1 и H2 или другим способом?

3) Есть ли другой способ получения координат XYZ без калибровки камер?

Мой код:

#include <opencv2/core/core.hpp>
#include <opencv2/calib3d/calib3d.hpp>
#include <opencv2/imgproc/imgproc.hpp>
#include <opencv2/highgui/highgui.hpp>
#include <opencv2/contrib/contrib.hpp>
#include <opencv2/features2d/features2d.hpp>
#include <stdio.h>
#include <iostream>
#include <vector>
#include <conio.h>
#include <opencv/cv.h>
#include <opencv/cxcore.h>
#include <opencv/cvaux.h>


using namespace cv;
using namespace std;

int main(int argc, char *argv[]){

    // Read the images
    Mat imgLeft = imread( argv[1], CV_LOAD_IMAGE_GRAYSCALE );
    Mat imgRight = imread( argv[2], CV_LOAD_IMAGE_GRAYSCALE );

    // check
    if (!imgLeft.data || !imgRight.data)
            return 0;

    // 1] find pair keypoints on both images (SURF, SIFT):::::::::::::::::::::::::::::

    // vector of keypoints
    std::vector<cv::KeyPoint> keypointsLeft;
    std::vector<cv::KeyPoint> keypointsRight;

    // Construct the SURF feature detector object
    cv::SiftFeatureDetector sift(
            0.01, // feature threshold
            10); // threshold to reduce
                // sensitivity to lines
                // Detect the SURF features

    // Detection of the SIFT features
    sift.detect(imgLeft,keypointsLeft);
    sift.detect(imgRight,keypointsRight);

    std::cout << "Number of SURF points (1): " << keypointsLeft.size() << std::endl;
    std::cout << "Number of SURF points (2): " << keypointsRight.size() << std::endl;

    // 2] compute descriptors of these keypoints (SURF,SIFT) ::::::::::::::::::::::::::

    // Construction of the SURF descriptor extractor
    cv::SurfDescriptorExtractor surfDesc;

    // Extraction of the SURF descriptors
    cv::Mat descriptorsLeft, descriptorsRight;
    surfDesc.compute(imgLeft,keypointsLeft,descriptorsLeft);
    surfDesc.compute(imgRight,keypointsRight,descriptorsRight);

    std::cout << "descriptor matrix size: " << descriptorsLeft.rows << " by " << descriptorsLeft.cols << std::endl;

    // 3] matching keypoints from image right and image left according to their descriptors (BruteForce, Flann based approaches)

    // Construction of the matcher
    cv::BruteForceMatcher<cv::L2<float> > matcher;

    // Match the two image descriptors
    std::vector<cv::DMatch> matches;
    matcher.match(descriptorsLeft,descriptorsRight, matches);

    std::cout << "Number of matched points: " << matches.size() << std::endl;


    // 4] find the fundamental mat ::::::::::::::::::::::::::::::::::::::::::::::::::::

    // Convert 1 vector of keypoints into
    // 2 vectors of Point2f for compute F matrix
    // with cv::findFundamentalMat() function
    std::vector<int> pointIndexesLeft;
    std::vector<int> pointIndexesRight;
    for (std::vector<cv::DMatch>::const_iterator it= matches.begin(); it!= matches.end(); ++it) {

         // Get the indexes of the selected matched keypoints
         pointIndexesLeft.push_back(it->queryIdx);
         pointIndexesRight.push_back(it->trainIdx);
    }

    // Convert keypoints into Point2f
    std::vector<cv::Point2f> selPointsLeft, selPointsRight;
    cv::KeyPoint::convert(keypointsLeft,selPointsLeft,pointIndexesLeft);
    cv::KeyPoint::convert(keypointsRight,selPointsRight,pointIndexesRight);

    /* check by drawing the points
    std::vector<cv::Point2f>::const_iterator it= selPointsLeft.begin();
    while (it!=selPointsLeft.end()) {

            // draw a circle at each corner location
            cv::circle(imgLeft,*it,3,cv::Scalar(255,255,255),2);
            ++it;
    }

    it= selPointsRight.begin();
    while (it!=selPointsRight.end()) {

            // draw a circle at each corner location
            cv::circle(imgRight,*it,3,cv::Scalar(255,255,255),2);
            ++it;
    } */

    // Compute F matrix from n>=8 matches
    cv::Mat fundemental= cv::findFundamentalMat(
            cv::Mat(selPointsLeft), // points in first image
            cv::Mat(selPointsRight), // points in second image
            CV_FM_RANSAC);       // 8-point method

    std::cout << "F-Matrix size= " << fundemental.rows << "," << fundemental.cols << std::endl;

    /* draw the left points corresponding epipolar lines in right image
    std::vector<cv::Vec3f> linesLeft;
    cv::computeCorrespondEpilines(
            cv::Mat(selPointsLeft), // image points
            1,                      // in image 1 (can also be 2)
            fundemental,            // F matrix
            linesLeft);             // vector of epipolar lines

    // for all epipolar lines
    for (vector<cv::Vec3f>::const_iterator it= linesLeft.begin(); it!=linesLeft.end(); ++it) {

        // draw the epipolar line between first and last column
        cv::line(imgRight,cv::Point(0,-(*it)[2]/(*it)[1]),cv::Point(imgRight.cols,-((*it)[2]+(*it)[0]*imgRight.cols)/(*it)[1]),cv::Scalar(255,255,255));
    }

    // draw the left points corresponding epipolar lines in left image
    std::vector<cv::Vec3f> linesRight;
    cv::computeCorrespondEpilines(cv::Mat(selPointsRight),2,fundemental,linesRight);
    for (vector<cv::Vec3f>::const_iterator it= linesRight.begin(); it!=linesRight.end(); ++it) {

        // draw the epipolar line between first and last column
        cv::line(imgLeft,cv::Point(0,-(*it)[2]/(*it)[1]), cv::Point(imgLeft.cols,-((*it)[2]+(*it)[0]*imgLeft.cols)/(*it)[1]), cv::Scalar(255,255,255));
    }

    // Display the images with points and epipolar lines
    cv::namedWindow("Right Image Epilines");
    cv::imshow("Right Image Epilines",imgRight);
    cv::namedWindow("Left Image Epilines");
    cv::imshow("Left Image Epilines",imgLeft);
    */

    // 5] stereoRectifyUncalibrated()::::::::::::::::::::::::::::::::::::::::::::::::::

    //H1, H2 – The output rectification homography matrices for the first and for the second images.
    cv::Mat H1(4,4, imgRight.type());
    cv::Mat H2(4,4, imgRight.type());
    cv::stereoRectifyUncalibrated(selPointsRight, selPointsLeft, fundemental, imgRight.size(), H1, H2);


    // create the image in which we will save our disparities
    Mat imgDisparity16S = Mat( imgLeft.rows, imgLeft.cols, CV_16S );
    Mat imgDisparity8U = Mat( imgLeft.rows, imgLeft.cols, CV_8UC1 );

    // Call the constructor for StereoBM
    int ndisparities = 16*5;      // < Range of disparity >
    int SADWindowSize = 5;        // < Size of the block window > Must be odd. Is the 
                                  // size of averaging window used to match pixel  
                                  // blocks(larger values mean better robustness to
                                  // noise, but yield blurry disparity maps)

    StereoBM sbm( StereoBM::BASIC_PRESET,
        ndisparities,
        SADWindowSize );

    // Calculate the disparity image
    sbm( imgLeft, imgRight, imgDisparity16S, CV_16S );

    // Check its extreme values
    double minVal; double maxVal;

    minMaxLoc( imgDisparity16S, &minVal, &maxVal );

    printf("Min disp: %f Max value: %f \n", minVal, maxVal);

    // Display it as a CV_8UC1 image
    imgDisparity16S.convertTo( imgDisparity8U, CV_8UC1, 255/(maxVal - minVal));

    namedWindow( "windowDisparity", CV_WINDOW_NORMAL );
    imshow( "windowDisparity", imgDisparity8U );


    // 6] reprojectImageTo3D() :::::::::::::::::::::::::::::::::::::::::::::::::::::

    //Mat xyz;
    //cv::reprojectImageTo3D(imgDisparity8U, xyz, Q, true);

    //How can I get the Q matrix? Is possibile to obtain the Q matrix with 
    //F, H1 and H2 or in another way?
    //Is there another way for obtain the xyz coordinates?

    cv::waitKey();
    return 0;
}

Ответы [ 3 ]

5 голосов
/ 22 мая 2012

StereoRectifyUncalibrated вычисляет просто планарное перспективное преобразование, а не ректификационное преобразование в пространстве объектов. Необходимо преобразовать это плоское преобразование в преобразование пространства объекта, чтобы извлечь матрицу Q, и я думаю, что некоторые параметры калибровки камеры требуются для этого (например, встроенные функции камеры). С этим предметом могут продолжаться некоторые исследовательские темы.

Возможно, вам придется добавить несколько шагов для оценки внутренних характеристик камеры и выделения относительной ориентации камер, чтобы заставить ваш поток работать правильно. Я думаю, что параметры калибровки камеры имеют жизненно важное значение для извлечения правильной трехмерной структуры сцены, если не используется активный метод освещения.

Кроме того, для уточнения всех оценочных значений до более точных значений требуются решения, основанные на корректировке блоков связки.

2 голосов
/ 29 мая 2012
  1. процедура выглядит нормально для меня.

  2. Насколько мне известно, в отношении трехмерного моделирования на основе изображений камеры откалиброваны явно или неявно откалиброваны. Вы не хотите явно калибровать камеру. вы все равно будете использовать эти вещи. сопоставление соответствующих пар точек определенно является широко используемым подходом.

1 голос
/ 15 июля 2013

Я думаю, вам нужно использовать StereoRectify, чтобы исправить ваши изображения и получить Q. Эта функция нуждается в двух параметрах (R и T) вращения и перемещения между двумя камерами. Таким образом, вы можете вычислить параметры с помощью solvePnP. Для этой функции требуются реальные трехмерные координаты определенного объекта и 2d точки на изображениях и соответствующие им точки

...