Вы хотите направить камеру на куб, и он понимает конфигурацию?
Распознавание объектов на фотографиях - это открытая проблема ИИ. Таким образом, вам нужно будет немного ограничить проблему, чтобы ее решить. Я предлагаю начать с чего-то вроде:
Куб будет сфотографирован с расстояния ровно 12 дюймов с источником света 100 Вт непосредственно за камерой. Куб будет установлен по диагонали, поэтому он представляет ровно 3 грани с углом в центре. Камера будет расположена так, чтобы фокусироваться непосредственно на углу куба в центре.
Снимок будет сделан. Затем куб будет повернут на 180 градусов по вертикали и горизонтали, так что остальные три грани будут видны. Будет сделана вторая фотография. Поскольку вы точно знаете, где должно быть каждое лицо, возьмите несколько пикселей из каждой области и предположите, что это цвет этого квадрата. Помните, что куб обычно скремблируется, а не равномерно, как показано на рисунке здесь. Поэтому вам всегда нужно смотреть на 9 * 6 = 54 маленьких квадратиков, чтобы получить цвет каждого из них.
Информация на этих двух рисунках определяет конфигурацию куба. Создайте изображение куба в той же конфигурации и позвольте пользователю подтвердить или исправить его.
Может быть проще сделать 6 снимков - по одному с каждого лица и перемещаться по лицам в четко определенном порядке. Помните, что центральный квадрат каждого лица не двигается, и определяет правильный цвет для этого лица.
Получив конфигурацию, вы можете использовать операции OpenGL, чтобы вращать кусочки куба. Это будет программа с сотнями строк кода для определения и поворота куба, плюс все, что вы делаете для распознавания изображений.