Как получить представление о классификации текста с анализом ошибок? - PullRequest
0 голосов
/ 17 мая 2019

Я делаю текстовую классификацию для диалекта. И я использую наивный байесовский классификатор с countVectorizer. У меня много неправильно классифицированных текстов. Есть ли способ проанализировать эти ошибки, чтобы выяснить, где классификация идет не так? Например, если бы я мог знать, какие слова используются для неправильной классификации текста как A, тогда как он должен быть классифицирован как B, и тогда я смогу извлечь эти слова из корпуса A.

Следует ли перейти к обучению без учителя с использованием кластеризации? или нейронные сети и глубокое обучение? если наивный байесовский классификатор не работает.

Кроме того, как я могу узнать, как countVectorizer классифицировал документы? И какие слова он использовал для классификации документа.

...