Когда мы должны использовать анализ главных компонентов? - PullRequest
1 голос
/ 09 июня 2019

В машинном обучении больше функций или измерений может снизить точность модели, поскольку существует больше данных, которые необходимо обобщить, и это известно как проклятие размерности.

Уменьшение размерности - это способ уменьшитьсложность модели и избежание переоснащения.Алгоритм анализа основных компонентов (PCA) используется для сжатия набора данных в элемент с более низкими измерениями, чтобы уменьшить сложность модели.

Когда / Как я должен учитывать, что в моем наборе данных много функций, и яследует искать PCA для уменьшения размеров?

1 Ответ

0 голосов
/ 09 июня 2019

простой ответ: его используют, когда нам нужно справиться с проклятием размерности

Когда мне следует использовать PCA?

  1. Хотите ли вы уменьшить количество переменных, но не можете определить переменные, которые можно полностью исключить из рассмотрения?
  2. Хотите ли вы, чтобы ваши переменные не зависели друг от друга?
  3. Комфортно ли вам делать независимые переменные менее понятными?

Если вы ответили «да» на все три вопроса, тогда PCA - хороший метод для использования. Если вы ответили «нет» на вопрос 3, вам не следует использовать PCA. Хороший урок здесь

...