Какие алгоритмы можно использовать для генерации евклидова вложения для многообразия, заданного парной матрицей геодезических расстояний? - PullRequest
0 голосов
/ 05 июня 2018

У меня есть квадратная матрица D (в настоящее время представленная в виде массива фигур (572, 572)), вероятно, соответствующая парным расстояниям между точками вдоль поверхности приблизительно цилиндрического объекта.Т.е. значение D[i,j] соответствует минимальной длине любого пути вдоль поверхности этого полого цилиндра.Как построить 3-мерное (или n-мерное) вложение этих 572 точек в евклидово пространство, которое сохраняет эти геодезические расстояния?

Текущие попытки

Алгоритмы, подобные локально линейное вложение и isomap способны взять эту матрицу попарных геодезических расстояний и вывести вложение так, чтобы попарные евклидовы расстояния были такими же, как и у исходных геодезических,Хотя в общем случае это не та же задача, в случае, когда выходные данные приближаются к гиперкубу в некотором измерении, на самом деле произошло желаемое преобразование (рассмотрим швейцарский рулон ), поскольку вложение само является многообразием,таким образом, евклидово расстояние соответствует геодезическому расстоянию.

Это не относится к даже более сложным объектам, таким как цилиндры.Обрабатывая геодезические расстояния как евклидово, антиподальные точки на желаемом цилиндре отображаются на места, расположенные значительно дальше друг от друга, чем хотелось бы, и соответствующая глобальная задача оптимизации часто приводит к разветвленной структуре с концами ветвей, соответствующими максимально удаленным антиподальным точкам,усиление малых возмущений при случайной выборке цилиндра.В общем, наивные применения этих алгоритмов, похоже, не решают проблему.

Другим несколько плодотворным (хотя и дорогостоящим) подходом была техника грубой monte carlo .Я генерирую случайные выборки из трубчатых объектов с переменными параметрами, пока не найду набор параметров, генерирующих геодезические матрицы расстояний, аналогичные моим, с точностью до перестановки (что решается не слишком неэффективно путем решения линейной системы преобразования этой матрицы расстояний в шахту и тестированиячтобы увидеть, если результат находится рядом с матрицей перестановок).Затем выполняется почти оптимальное отображение из моих 572 точек на этот объект, сохраняющее попарные расстояния, путем нахождения ближайшей матрицы перестановок к вышеупомянутой матрице почти перестановок.

Это дает правдоподобные результаты, но предполагает формуданные и это ужасно дорого.Я выполнил некоторые из наиболее очевидных оптимизаций, таких как работа с небольшими случайными выборками вместо всего набора данных и использование основанных на градиенте методов для оценки параметров, но было бы неплохо использовать более универсальную технику.

Предостережения

Эта проблема, конечно, не имеет единственного решения.Даже если предположить, что многообразия могут быть однозначно идентифицированы в трехмерном пространстве из конечной равномерной выборки, простое сжатие цилиндра дает форму с одинаковыми геодезическими и разными евклидовыми расстояниями (отсюда и другое вложение).Это не беспокоит меня больше, чем LLE и Isomap, приводящие к различным решениям, и я буду в порядке с любым правдоподобным ответом.

Что касается однозначной идентификации многообразий из конечной выборки, то для аргумента я будухорошо, просто используя атрибут dist_matrix_ из встроенного класса Isomap из пакета scikit-learn без каких-либо специальных параметров для поиска геодезических.Это выполняет ненужный шаг MDS, но это не очень дорого, и это работает из коробки.Затем мы хотели бы вложение, которое минимизирует расстояние Фробениуса между исходной матрицей геодезического расстояния и атрибутом dist_matrix_.

Ответы [ 2 ]

0 голосов
/ 18 сентября 2018

Четвертая глава этой кандидатской диссертации

«О параметризации движения в последовательностях изображений с фиксированных точек зрения», Манфред Георг, Вашингтонский университет, 2010

доступно: https://openscholarship.wustl.edu/cgi/viewcontent.cgi?article=1127&context=etd

обсуждает некоторые из этих проблем с алгоритмами, которые зависят, например, от того, является ли, например, коллектор действительно цилиндром (или конусом или чем-то еще), а также относительной шириной и длиной цилиндра.

В зависимости от вашей конечной цели, альтернативы, такие как t-SNE, могут подойти лучше;они полностью снимают глобальные геодезические ограничения расстояний и, следовательно, могут быть более гибкими с такими формами, как цилиндры, где невозможно внедриться в евклидово пространство и сохранить геодезические.

0 голосов
/ 07 июня 2018

В то время как я первоначально исключил локально линейное вложение и другие подобные методы, это, кажется, было поспешным.Поскольку многообразия фактически локально линейны, достаточно хорошо выбранный, достаточно хороший многообразие обладает свойством того, что его небольшие геодезические расстояния приблизительно совпадают с их соответствующими евклидовыми расстояниями .

Имея это в виду, любая реконструкция, которая рассматривает ближайших геодезических соседей как ближайших евклидовых соседей и аппроксимирует евклидово расстояние через геодезическое расстояние, будет приблизительно сохранять глобальное геодезическое расстояние , вплоть до накопленного члена ошибки.Это означает, что все стандартные алгоритмы, которые используют только локальные расстояния, имеют возможность обеспечить приблизительно правильное вложение.Они включают в себя и не ограничиваются

  • Локально линейное вложение
  • Isomap
  • Спектральное вложение

Некоторые классические алгоритмы встраивания не будет работать правильно в этом приложении, так как они пытаются сохранить все расстояния, а большие геодезические, вероятно, являются плохим представлением евклидова расстояния.Например, многомерное масштабирование плохо подходит без модификаций.

Примечание Причина, по которой LLE, по-видимому, дал плохие результаты в моем предварительном анализе, заключается в том, что одно из моих предположений было нарушено - многообразие былодостаточно хорошо отобранный.Я применял его к простым формам с известным желаемым поведением, но по ошибке использовал слишком мало точек, чтобы обеспечить быстрый цикл обратной связи в моем анализе.Коллекторы с лучшей выборкой ведут себя точно так, как они должны.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...