R: многомерное масштабирование - PullRequest
4 голосов
/ 26 февраля 2010

У меня есть несколько вопросов:
1. В чем разница между isoMDS и cmdscale?
2. Могу ли я использовать асимметричную матрицу?
3. Есть ли способ определить оптимальное количество измерений (в результате)?

1 Ответ

10 голосов
/ 26 февраля 2010
  1. Одним из методов MDS является distance scaling, и он делится на метрический и неметрический. Другой - classical scaling (также называемый distance geometry теми, кто в биоинформатике). Классическое масштабирование в R можно выполнить с помощью команды cmdscale. Метод неметрического масштабирования расстояний Крускала (с использованием функции напряжения и изотонической регрессии) может быть выполнен с помощью команды isoMDS в библиотеке MASS. Стандартная обработка classical scaling приводит к проблеме собственного разложения и, как таковая, аналогична PCA, если целью является уменьшение размерности. Методы distance scaling, с другой стороны, используют итерационные процедуры для достижения решения.

  2. Если вы ссылаетесь на структуру расстояний, я думаю, вы должны передать структуру класса dist, которая является объектом с информацией о расстоянии. Или (симметричная) матрица расстояний, или объект, который может быть приведен к такой матрице с помощью as.matrix (). (Как я прочитал в справке, используется только нижний треугольник матрицы, остальное игнорируется).

  3. (для классического метода масштабирования): Один из способов определения размерности результирующей конфигурации заключается в рассмотрении собственных значений doubly centered симметричной матрицы B (= HAH). Обычная стратегия состоит в том, чтобы построить упорядоченные собственные значения (или некоторую их функцию) по отношению к измерению, а затем идентифицировать измерение, при котором собственные значения становятся «стабильными» (то есть не меняются перцептивно). В этом измерении мы можем наблюдать «колено», которое показывает, где происходит стабильность (для точек n-мерного пространства стабильность в графике должна иметь место в измерении n + 1). Для упрощения графической интерпретации классического решения по скейлингу мы обычно выбираем n малым, порядка 2 или 3.

...