Результаты PCA по несбалансированным данным с дубликатами - PullRequest
0 голосов
/ 12 декабря 2018

Я использую декомпозицию sklearn IPCA и удивляюсь, что если я удаляю дубликаты из моего набора данных, результат будет отличаться от «нечистого».

В чем причина?Как я думаю, разница одинакова.

1 Ответ

0 голосов
/ 14 декабря 2018

Ответ прост.Дубликаты из набора данных изменяют дисперсию.

https://stats.stackexchange.com/a/381983/230117

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...