Сначала вы должны запустить тест ANOVA / Kruskall Wallis, чтобы проверить, какие переменные хорошо подходят для вашей задачи.Я не думаю, что для 36 переменных вам понадобится PCA, поскольку это приведет к тому, что ваша модель потеряет некоторую объяснимость.
Помните, что PCA уменьшит размерность, а также объяснит только часть дисперсии данных.Анализ факторов будет генерировать группы переменных в факторах, если вы хотите запустить сегментированную логистическую регрессию для каждого фактора сгруппированных переменных.
Если вы хотите построить экономную логистическую регрессию, вы можете применить некоторую регуляризацию, чтобывы можете увеличить его свойства обобщения, вместо уменьшения количества переменных.
Вы можете использовать следующие пакеты R: каретка (логистическая регрессия), ROCR (AUC), ggplot (plot), DMwR (выбросы), мыши (пропущенные значения)
Также, если вы хотите сделать регуляризацию, вы можете использовать следующую формулу:


В этом случае вы можете разработать регуляризацию с нуля, без библиотеки, чтобы отрегулировать наклон сигмовидной кишки, чтобы вы могли правильно классифицировать ваши классы:
