Я вижу объект параллелепипеда, а не куб. Я бы придерживался классического CV, а не DL, и работал с геометрическим компьютерным зрением.
То, что вы пытаетесь сделать, - это найти преобразование (функцию), которое сделало бы два объекта инвариантами (т.е. они одинаковы). В резюме вы можете работать с различными аспектами изображения (цвет, интенсивность, градиенты, мип-карты и т. Д.); То, что я вижу, является общим, то есть то, что поможет вам найти вашу функцию, это форма (2D и 3D), геометрия ваших объектов.
Я бы посоветовал вам попробовать несколько алгоритмов из геометрического компьютерного зрения [1] и просмотреть геодезические методы [2], [3], последнее позволит вам иметь дело с различными объемными формами, а не только с определенной плоской формой (например, прямоугольник с соотношением: = ширина / высота). Я бы пошел на эти шаги:
- подготовить изображения, чтобы сделать их максимально похожими (фактически сделать их пространство выражения максимально похожим) ( уменьшение размера ; например, нормализовать контраст и яркость, добавить фильтр нижних частот, определить границы )
- и затем приступить к обучению с помощью классификатора (SVM, AdaBoost ...); вам нужно подготовить основную истину, обучающий набор и набор тестов (для этого есть множество ссылок).
Регистрация может быть полезна для этапа подготовки; это зависит от вашего конвейера.
Что связано с DL, так это то, что все создается сразу (это неудобно, если вы ищете модульность, и преимущество, если вы хотите «более простую» подготовку), но это также требует действительно больших наборов и очень интенсивно использует компьютер ( нужно время и вычислительная мощность). В зависимости от ваших требований (время, деньги, качество результатов) вы можете найти один метод, который лучше подходит для вашего проекта, но вы все же хотите попробовать другой или все из них (например, тест / обзор).
[1] Элементы геометрического компьютерного зрения, Андреа Фузиелло
http://homepages.inf.ed.ac.uk/rbf/CVonline/LOCAL_COPIES/FUSIELLO4/tutorial.html
[2] Геодезические методы в компьютерном зрении и графике, Габриэль Пейре, Микаэль Пешо, Рено Керивен и Лоран Д. Коэн https://www.researchgate.net/publication/47523356_Geodesic_Methods_in_Computer_Vision_and_Graphics
[3] https://scholar.google.com/scholar?hl=en&num=100&ie=UTF-8&q=computer+vision+geodesic