Строковые данные и классификация - PullRequest
0 голосов
/ 30 мая 2020

У меня есть набор данных, состоящий из строки и класса, которому она принадлежит. Строка состоит из 4 букв. Класс может быть либо «0», либо «1». Некоторые примеры -

DKWL----0
FCHN----0
KDQP----0
IHGS----1
....

Я использую «CountVectorizer» из sklearn.feature_extraction.text для извлечения функций и ComplementNB для обучения модели, но это работает не так хорошо, поэтому я хочу спросить, есть ли есть ли другие подходы для извлечения дополнительных функций?

Заранее спасибо.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...