Я хотел бы построить классификатор текста НЛП в Python, который разбивает текст на одну из трех категорий (A, B или C).Более важно, чтобы классификатор правильно классифицировал А, чем В или С. например, Если я дал вес категории 10, 1, 1, то в 10 раз важнее получить правильное значение A, чем B или C.
- Идея: использовать sklearns
predict_proba
функция для получения доверительных баллов.Запустите макрос, который говорит, что если достоверность <70% (произвольно), то просто переклассифицируйте в B или C, чтобы избежать ошибочной классификации A. (Мне это не нравится по ряду причин + В идеале, я хочу сами <code>predict_proba вероятностичтобы отразить мою классификационную предвзятость.)
Может кто-нибудь указать мне на функцию, которая занимается этой проблемой, или посоветовать подход?