Я смотрю на набор данных Kitti и, в частности, как преобразовать точку мира в координаты изображения. Я посмотрел на README, и ниже написано, что мне нужно сначала преобразовать в координаты камеры, а затем умножить на матрицу проекции. У меня есть 2 вопроса, не из компьютерного зрения
- Я посмотрел на числа из calib.txt и, в частности, матрица 3x4 с ненулевыми значениями в последнем столбце. Я всегда думал, что эта матрица
= K[I|0]
, где K - собственная матрица камеры. Итак, почему последний столбец ненулевой и что это значит? например, P2
array([[7.070912e+02, 0.000000e+00, 6.018873e+02, 4.688783e+01],
[0.000000e+00, 7.070912e+02, 1.831104e+02, 1.178601e-01],
[0.000000e+00, 0.000000e+00, 1.000000e+00, 6.203223e-03]])
- После применения проекции в [u, v, w] и деления u, v на w, находятся ли эти значения относительно начала координат в центре изображения или начала координат в верхнем левом углу изображения?
README:
calib.txt: данные калибровки для камер: P0 / P1 - 3x4
проекция
матрицы после выпрямления. Здесь P0 обозначает левый, а P1 обозначает
Правильная камера. Тр превращает точку из велодинных координат в
левая выпрямленная система координат камеры. Чтобы отобразить точку X из
Сканер велодина до точки х в i-й плоскости изображения, таким образом, вы должны
преобразовать это как:
x = Pi * Tr * X