У меня есть датафрейм с несколькими категориальными и числовыми функциями.К этому я присоединил мой BoW (CountVectorizer) текстового столбца, что привело к более чем 56 000 функций.Поэтому я планирую сделать PCA для уменьшения количества функций.
Я думаю, что выбор правильного числа основных компонентов здесь крайне важен, но я не понимаю, сколько n_components
следует рассмотреть здесь?