Я делаю модель классификации текста на большом корпусе, однако подгонка моделей занимает много времени, так как я работаю с более чем 15 тысячами функций в моей модели.Поэтому я хотел уменьшить это путем выбора функций.Большинство обычных функций, таких как findCorrelation()
и rfeControl
, вызывают проблемы с памятью.Кто-нибудь из вас знает методы выбора функций, которые не требуют много памяти?
Примечания: - Это уже небольшая часть всего корпуса, поэтому поднаборы еще больше не идеальны.- Я уже работаю над самым мощным рабочим пространством.