В настоящее время я использую PCA для распознавания рукописных цифр для базы данных MNIST (каждая цифра имеет около 1000 наблюдений и 784 функций). Единственное, что меня смущает, так это то, что точность наивысшая, когда у него 40 компьютеров. Если количество компьютеров увеличивается с этой точки, точность начинает непрерывно падать.
Из моего понимания PCA я подумал, что чем больше компонентов у меня есть, тем лучше я могу описать набор данных. Почему точность становится меньше, если у меня слишком много компьютеров?