когда основные компоненты PCA образуют основу для набора данных? - PullRequest
0 голосов
/ 18 ноября 2018

Предположим, что я делаю PCA для набора данных и получаю k принципов, которые объясняют 100% общей дисперсии набора данных.

Можно сказать, что любое наблюдение из набора данных может быть восстановлено по среднему значению плюс линейная комбинация всех основных компонентов.

Когда я делаю анализ по различным наборам данных, я заметил, что иногда наблюдения могут быть восстановлены с помощью линейной комбинации только основных компонентов (v1, v2, .., vk) без использования среднего, даже если наблюдения неимеют нулевое среднее.

Это означает, что среднее значение наблюдений можно восстановить, используя также линейную комбинацию основных компонентов (v1, v2, .., vk).Похоже, что это происходит, когда наблюдения на самом деле являются линейными комбинациями другого набора векторов (x1, x2, ..., xk).

Для набора данных, содержащего векторы, принадлежащие векторному пространству, натянутому на некоторый вектор x1, x2, ... xk, если я сделаю PCA для этого набора данных, будут ли основные компоненты всегда в состоянии восстановить наблюдения только в одном наборе данных без добавления среднего значения?Такое чувство, что ПК находит ортогональную основу для этого набора данных, но почему?

...