Оценка Стэнфордского классификатора CRF - PullRequest
0 голосов
/ 07 марта 2019

Я делаю классификатор NER для трех тегов (PER, ORG, LOC). Я проверяю свои результаты, основываясь на Стэнфордском классификаторе CRF. Поэтому я хотел бы знать, как работает часть оценки классификатора stanford crf. Учитывает ли он все теги (PER, ORG, LOC, O) или только (PER, ORG, LOC) ??

1 Ответ

1 голос
/ 11 марта 2019

Счет F1, основанный на отзыве и точности извлеченных объектов.Если у вас есть схема тегирования, например (PER, ORG, LOC), сущность - это просто последовательность последовательных токенов с одним и тем же тегом.Обратите внимание, что последовательности токенов с меткой O не считаются объектами.

В окончательном отчете дается F1 для всех объектов, а также баллы F1 для каждого типа объектов.

Обратите также внимание,нет частичного кредита.Вы либо находите сущность правильно, либо нет.Таким образом, в примере предложения «Джо Смит живет в Калифорнии», оба «Джо» и «Смит» должны быть помечены как PERSON, чтобы получить правильно найденную PERSON сущность.Если бы просто «Джо» был помечен как PERSON (а «Смит» был помечен как O), вы бы получили оценку 0 правильных PERSON сущностей и 1 неправильной PERSON сущности.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...