Возможно, будет алгоритм для эмуляции стереоскопических изображений, но он не может быть таким же.
Причина довольно проста. В 2D-видео не только отсутствует информация о глубине (которой недостаточно для получения стереоскопического видео), но и отсутствуют скрытые поверхности, которые были бы видны с другой точки зрения.
Каждый может подумать, что информация о глубине может быть извлечена из доступной информации, и это правда. Но недостающая информация не может быть настолько точной, чтобы иметь хороший стереоскопический эффект.
Кроме того, я слышал о системе, которая может извлекать точные 3D-модели из 8 (восьми!) Камер, направленных на одну и ту же цель. Так точно и правильно подражать движениям одежды. Однако это делается обработкой 8 (восьми!) 2D видео. Как можно достичь такого же результата только с одним 2D-видео?
Достижение желаемого результата в основном зависит от доступности информации, и в этом случае (ИМХО) информации не хватает. Хотя можно было бы попытаться эмулировать стереоскопический эффект из 2D-видео, но, по сути, он требует кропотливой работы, длительной обработки и, как следствие, низкого качества по сравнению с оригинальным стереоскопическим видео.
Я хотел бы помнить, что трехмерное изображение создается нашим мозгом. Глаза могут захватывать только 2D-изображения, а наш мозг, обрабатывая эти два изображения, может генерировать изображение глубины видимых объектов.