Использование рекурсивной функции исключения занимает слишком много времени с классификацией текста - PullRequest
0 голосов
/ 21 мая 2019

Я делаю классификацию текста на диалекте. Точность упала с 90% до 70%, когда я тестировал модель. Я думал, что я должен уменьшить возможности, потому что у меня есть около 45000 функций. Так что я использую для этого рекурсивное удаление функций:

    from sklearn.feature_selection import RFECV
    m=RFECV(MultinomialNB(), scoring="accuracy")

    m.fit(X,y_train) #I have vectorized X using countVectorizer.

Есть ли другой способ уменьшить возможности? Потому что этот метод занимает слишком много времени. Я использовал max_features в countvectorizer, но он удаляет все соответствующие функции. Я хочу что-то вроде того, где я могу попробовать все комбинации и найти лучшую точность, все это автоматизировано с помощью RFECV.

...