При реализации монокулярной SLAM или структуры из движения с использованием одной камеры перевод может быть оценен до неизвестного масштаба. Доказано, что без какой-либо внешней информации этот масштаб не может быть определен. Однако мой вопрос: как унифицировать эту шкалу во всех суб-переводах. Например, если у нас есть 3 кадра (Frame0, Frame1 & Frame2), мы применили отслеживание следующим образом:
- Frame0 -> Frame 1: R01, T01 (R & T можно извлечь, используя F Matrix и K матрица и разложение основной матрицы)
- Кадр 1-> Кадр 2: R12, T12
Проблема в том, что T01 и T12 нормализованы, поэтому их величина равна 1. Однако в реальном Величина T01 может быть в два раза больше, чем T12.
Как мне восстановить относительную величину между T01 и T12?
PS Я не хочу знать, что такое T01 или T12. Я просто хочу знать, что | T01 | = 2 * | T12 |.
Я думаю, что это возможно, потому что алгоритмы Monocular SLAM или SFM уже существуют и работают хорошо. Итак, должен быть какой-то способ сделать это.