Я работаю над проблемой классификации объектов и использую данные лидара и камеры из набора данных Kitti.,
В этой статье: http://ww.cvlibs.net/publications/Geiger2013IJRR.pdf, они предоставляют формулы для проецирования 3d PointCloud на плоскость изображения i-й камеры, но некоторые вещи я не понимаю:
Следующее уравнение ((3):
Если 3D-точка X находится на изображении с велодинной камеры, а Y на изображении с i-й камеры, почему X имеет четыре координаты, а Y три? Должно было быть 3 и 2, нет?
Мне нужно спроецировать трехмерное облако точек на плоскость изображения камеры, чтобы затем создать лидарные изображения, чтобы использовать их в качестве канала для CNN. Кто-нибудь, у кого есть идеи для этого?
Заранее спасибо