Ответы на ваши вопросы:
1) Квадратные корни собственных значений матрицы рассеяния (например, XX.T) являются сингулярными значениями X (см. Здесь: https://math.stackexchange.com/a/3871/536826). Таким образом, вы возводите их в квадрат. Важно : исходная матрица X должна быть центрирована (данные были предварительно обработаны, чтобы иметь нулевое среднее значение) для того, чтобы вышеупомянутое удержалось.
2)Да, это путь.объясненная переменная вычисляется на основе единичных значений.См. Пункт 1.
3) Это то же самое, но в случае, если вы описываете, вы ДОЛЖНЫ проецировать данные, а затем выполнять дополнительные вычисления.В этом нет необходимости, если вы просто вычисляете его, используя собственные значения / значения в единственном числе (см. Пункт 1 снова для связи между этими двумя).
Наконец, имейте в виду, что не все действительно хотят проецировать данные.Кто-то может получить только собственные значения, а затем немедленно оценить объясненную дисперсию БЕЗ проецирования данных.Так что это лучший золотой стандарт для этого.
РЕДАКТИРОВАТЬ 1:
Ответ на отредактированный пункт 2
Нет,PCA - неконтролируемый метод.Он преобразует только данные X, а не Y (метки).
Опять же, объясненная дисперсия может быть вычислена быстро, легко и с использованием половины строки кода с использованием собственных значений / единичных значений ИЛИ, как вы сказали, с использованием проецируемогонапример, данные оценивают ковариацию проецируемых данных, тогда отклонения ПК будут в диагонали.