PCA: Что это означает, что количество необходимых компьютеров для данного процентного объяснения изменяется? - PullRequest
0 голосов
/ 22 февраля 2019

Скажем, у человека есть программа, которая выполняет PCA.Программа рассчитывает количество компьютеров, необходимых для покрытия заданной доли общего отклонения в данных, например, 95%.

Скажем, количество компьютеров, необходимых для покрытия 95% отклонения, равно 10 дляданные, используемые в момент времени t = 1.

При t = 2 мы перезапускаем программу с данными из t = 2.Для t = 2 количество ПК, необходимых для покрытия 95% дисперсии, равно 5.

Следовательно, количество ПК, необходимых для покрытия 95% дисперсии, уменьшилось с 10 до 5 с t= 1 к t = 2.

Основной вопрос:

Можем ли мы сделать какие-либо выводы об изменении данных с t = 1 на t = 2 в этом случае?

Пример:

Можем ли мы сказать что-то вроде: «Поскольку число компьютеров уменьшается с t = 1 до t = 2, в данных больше корреляцииt = 1, чем при t = 2. Чем больше корреляция в данных, тем меньше ПК требуется для покрытия определенной доли данных в данных. "

1 Ответ

0 голосов
/ 07 марта 2019

Да, если исходные переменные сильно коррелируют, уменьшенное число компонентов может объяснить от 80% до 90% дисперсии, а процент дисперсии соответствует проценту информации из ваших данных, которая была сохраненаПК.Кроме того, если вы хотите получить больше информации о PCA, вы можете прочитать этот замечательный комментарий: https://stats.stackexchange.com/questions/2691/making-sense-of-principal-component-analysis-eigenvectors-eigenvalues/140579#140579

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...