Я дал задание извлечь определенную дату события из огромного набора документов. В документе есть даты для нескольких событий, но модель должна извлечь дату, указанную c для события. Я применил комбинацию регулярного выражения и модели Spacy, чтобы получить требуемый результат. Теперь модель может иметь 3 результата: 1. Ожидаемая дата - правильная добыча 2. Дата, связанная с другими событиями, которая не требуется - неправильное извлечение 3. Пустой вывод - неправильное извлечение (неожиданный результат)
Итак, для целей оценки, какие метрики мне следует использовать, потому что здесь у меня только правильное и неправильное извлечение? Модель не может извлекать дату из документа, в котором дата вообще не упоминается (Ложно-положительный).
Будет очень полезно, если вы предложите показатели оценки, которые можно использовать в качестве доказательства для модели.