То, что вы хотите сделать, действительно возможно, но (довольно много но)
для 3D реконструкции:
- Для всего, кроме самых простых фигур, вам нужно больше, чем несколько десятков изображений.
- Форма, которую вы восстанавливаете, должна иметь много узнаваемых элементов, которые достаточно похожи под разными углами, чтобы вы могли соответствовать им.
- Освещение должно быть достаточно постоянным по всему вашему набору изображений, иначе тени отбросят вас (или вам нужно еще больше изображений)
- даже с очень многофункциональными объектами (т. Е. Большим количеством вариаций цвета и формы) Точность трехмерного восстановления по любой согласованной паре объектов будет ужасной, если вы не обладаете полным знанием параметров (положения, направления обзора и открытия) угол) камеры, используемой для каждого снимка.
Все эти проблемы могут быть решены, поэтому предположим, что вы это сделали, и теперь у вас есть новое изображение объекта, которое вы хотите сопоставить с вашей трехмерной формой.
Конечно, вы можете попытаться найти 2D-проекцию вашей фигуры, которая соответствует новой картинке, но пространство для поиска там огромно. Вероятно, было бы намного проще и быстрее использовать систему поиска и сопоставления объектов, которую вы построили для первоначальной трехмерной реконструкции, чтобы напрямую сопоставить новое изображение с существующим набором и найти, где оно вписывается в объект таким образом.
Так что, как только вы решите проблему создания начальной трехмерной реконструкции, ваш второй шаг в основном будет выполнен.
Фотосинтез - яркий пример этих двух шагов. Просмотрите сайт, попробуйте найти некоторые ссылки, которые у них есть.
Что касается вашего последнего шага, сильного распознавания объектов, просто представьте пространство поиска! То, что вам нужно для надежного распознавания объектов, помимо хорошего представления объектов, которые вы хотите распознать, - это хороший способ поиска в пространстве известных вам объектов и хороший способ представления вашего нового объекта (изображения объекта в этот случай) в этом пространстве. Это то, о чем я почти ничего не знаю.
Для сопоставления одного и того же объекта в разных 2D-изображениях имеется SIFT-функций . Но я не думаю, что это хорошо переводится в 3D.