Я работаю над проектом, который я сделал ниже: -
- Найдите столбцы с отклонением 0 и избавьтесь от них. c. и выбросы и избавьтесь от них или замените значения
- Apply One hot encoder.
- Выполните уменьшение размерности с помощью PCA
- Предскажите мои тестовые значения с помощью XGBoost.
В основном этот проект направлен на сокращение времени тестирования, затрачиваемого на производственную единицу. После использования PCA я обнаружил, что из 560 функций, когда я использую всего 200 различных компонентов в PCA, я могу достичь 98,5% дисперсии. Теперь, как мне узнать, какие из всех функций повлияли на дисперсию 98,5%, чтобы я мог избавиться от других функций, на которые уходит много времени на ускорение производства? Есть ли способ найти это?
Спасибо