Категории весовой категоризации в НЛП - PullRequest
0 голосов
/ 18 июня 2019

Я хотел бы построить классификатор текста НЛП в Python, который разбивает текст на одну из трех категорий (A, B или C).Более важно, чтобы классификатор правильно классифицировал А, чем В или С. например, Если я дал вес категории 10, 1, 1, то в 10 раз важнее получить правильное значение A, чем B или C.

  • Идея: использовать sklearns predict_proba функция для получения доверительных баллов.Запустите макрос, который говорит, что если достоверность <70% (произвольно), то просто переклассифицируйте в B или C, чтобы избежать ошибочной классификации A. (Мне это не нравится по ряду причин + В идеале, я хочу сами <code>predict_proba вероятностичтобы отразить мою классификационную предвзятость.)

Может кто-нибудь указать мне на функцию, которая занимается этой проблемой, или посоветовать подход?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...