Таким образом, у них в основном есть 1 исходное изображение, которое они рассматривают как вид слева для алгоритма восприятия глубины, но, поскольку вам необходимо стереозрение для вычисления глубины в неподвижном изображении, они используют нейронную структуру для синтеза вида справа.
1 Размерная корреляция берет 2 последовательности и вычисляет корреляцию в каждой точке, давая вам еще одну 1D последовательность той же длины, что и 2 входа. Поэтому, если применить эту корреляцию вдоль определенной оси тензора, результирующий тензор не изменит свою форму.
Интуитивно они думали, что имеет смысл коррелировать изображения вдоль горизонтальных осей немного как чтение изображений, как чтение книги, но в этом случае это должно иметь эффект, похожий на то, что вещи, которые находятся дальше, также кажутся точки, которые ближе друг к другу на левой и правой сторонах. Корреляция, вероятно, выше для левой и правой боковых точек данных, которые находятся дальше, и это значительно упрощает классификацию глубины для нейронной сети.