У меня есть набор данных, состоящий из строки и класса, которому она принадлежит. Строка состоит из 4 букв. Класс может быть либо «0», либо «1». Некоторые примеры -
DKWL----0
FCHN----0
KDQP----0
IHGS----1
....
Я использую «CountVectorizer» из sklearn.feature_extraction.text для извлечения функций и ComplementNB для обучения модели, но это работает не так хорошо, поэтому я хочу спросить, есть ли есть ли другие подходы для извлечения дополнительных функций?
Заранее спасибо.