Я выполняю NER, используя sklearn-crfsuite.Я пытаюсь сообщить о упоминании сущности по случаю упоминания сущности как истинно положительное (как прогноз, так и ожидаемое правильное, даже если нет сущности), ложно положительное (предсказание говорит да, ожидаемое нет) или ложно отрицательное (предсказание говорит нет, ожидаемое да).
Я не вижу, как получить что-либо кроме сводной статистики на основе тегов / токенов для производительности NER.
Я бы согласился с другим способом группировки упоминаний сущностей, таких как: правильный, неправильный, частичный, отсутствующий, ложный.Я могу написать целую кучу кода вокруг себя, чтобы попытаться выполнить это (и, возможно, придется), но должен быть один вызов, чтобы получить эту информацию?
Вот некоторые из вызовов, которыеделается для получения сводной статистики:
from sklearn import metrics
report = metrics.classification_report(targets, predictions,
output_dict=output_dict)
precision = metrics.precision_score(targets, predictions,
average='weighted')
f1 = metrics.f1_score(targets, predictions, average='weighted')
accuracy = metrics.accuracy_score(targets, predictions)