Я использую декомпозицию sklearn IPCA и удивляюсь, что если я удаляю дубликаты из моего набора данных, результат будет отличаться от «нечистого».
В чем причина?Как я думаю, разница одинакова.
Ответ прост.Дубликаты из набора данных изменяют дисперсию.
https://stats.stackexchange.com/a/381983/230117