Как вернуться к соответствующим функциям, выбранным с помощью анализа главных компонентов - PullRequest
0 голосов
/ 01 августа 2020

Я работаю над проектом, который я сделал ниже: -

  1. Найдите столбцы с отклонением 0 и избавьтесь от них. c. и выбросы и избавьтесь от них или замените значения
  2. Apply One hot encoder.
  3. Выполните уменьшение размерности с помощью PCA
  4. Предскажите мои тестовые значения с помощью XGBoost.

В основном этот проект направлен на сокращение времени тестирования, затрачиваемого на производственную единицу. После использования PCA я обнаружил, что из 560 функций, когда я использую всего 200 различных компонентов в PCA, я могу достичь 98,5% дисперсии. Теперь, как мне узнать, какие из всех функций повлияли на дисперсию 98,5%, чтобы я мог избавиться от других функций, на которые уходит много времени на ускорение производства? Есть ли способ найти это?

Спасибо

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...