Mallet: получить значение достоверности в алгоритме Maxent - PullRequest
2 голосов
/ 05 июля 2011

Я использую максимальный алгоритм в молотке для классификации этикеток. Мне было интересно, возможно ли получить какое-то значение достоверности для метки, предсказанной классификатором maxent. Что мне в основном нужно, так это прогнозы верхнего K (не для каждого токена, а из целых данных), в которых классификатор наиболее уверен и использует их для начальной загрузки. Есть ли способ сделать это?

1 Ответ

2 голосов
/ 08 июля 2011

Посмотрите на объект маркировки, возвращаемый при вызове любого метода классификации молотка. Этот класс содержит все вычисленные оценки для каждой метки: лучшим из них становится ответ (именно тот, который возвращается методом getBestLabel ()). Проблема в том, что эти оценки обычно не являются вероятностями. Я не знаком с классификатором максимума Маллета - вам нужно будет взглянуть на код и определить, можно ли как-то «привести» возвращаемые оценки к вероятностям или, возможно, уже в правильной форме. В любом случае это звучит так, как будто вы хотите назначить значение относительной разницы между лучшими баллами. Опять же, это зависит от точных деталей максимального классификатора. Так что посмотрите на экземпляры объекта Labeling, фактически возвращенные в ваш набор данных, и примите правильные решения.

Надеюсь, это поможет!

...