Я создал простую (2.1.8) модель, которая работает с некоторыми метками, такими как данные, время, координаты, звезды ...
теперь я хочу видеть все метрики, связанные с каждой сущностью, использующей spacy. что-то вроде этого
precision recall f1-score support
B-LOC 0.810 0.784 0.797 1084
I-LOC 0.690 0.637 0.662 325
B-MISC 0.731 0.569 0.640 339
I-MISC 0.699 0.589 0.639 557
B-ORG 0.807 0.832 0.820 1400
I-ORG 0.852 0.786 0.818 1104
B-PER 0.850 0.884 0.867 735
I-PER 0.893 0.943 0.917 634
Я заметил, что для этого могу использовать Scorer:
https://spacy.io/api/scorer
Я пишу что-то вроде этого
scorer = nlp.evaluate(docs_golds, verbose=True)
print(scorer.scores)
но я не знаю, как сделать "документы-золото" из моего текста? У меня есть данные в формате JsonL, а также прочитал данные в виде текста в моей записной книжке, а затем использовал мою модель для NER следующим образом:
doc=nlp(str1)
. Есть ли у вас какие-либо идеи, как я могу решить эту проблему и вообще, что вы рекомендуете? чтобы показать производительность моей модели, у меня есть точность, но, конечно, точности не достаточно для выполнения любой задачи?
Я прочитал это
Есть ли способ с NER spaCy для расчета показателейпо типу сущности?
но я хочу сделать это по просторам. Кажется, это возможно в просторной 2