Рекомендации по моделям классификации текста для работы с почти 200К метками - PullRequest
0 голосов
/ 26 июня 2019

Так что в основном я хочу классифицировать много ярлыков (200K +). Есть ли какие-либо рекомендуемые модели, которые я должен попробовать, чтобы иметь относительно хорошую точность и не занимать дни, чтобы закончить?

Я пытался использовать Sklearn's OneVsRestClassifier для LinearRegression, и я оставил его на ночь, а примерка все еще не закончена

Я считаю, что должны быть более эффективные алгоритмы мультиклассовой классификации для НЛП

Заранее спасибо

1 Ответ

0 голосов
/ 26 июня 2019

Учитывая количество данных, которые у вас есть, рассмотрим многочленный Наивный Байес.Sklearn имеет очень прямолинейную реализацию этого: https://scikit -learn.org / stable / modules / generate / sklearn.naive_bayes.MultinomialNB.html Это будет быстрее, чем использование нейронной сети.Множество обучающих данных для простой модели всегда будет иметь большую предсказательную силу, чем большая модель с меньшим количеством данных.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...