рассчитать все метрики пользовательской модели распознавания именованных объектов (NER), используя Spacy и ner.manual - PullRequest
1 голос
/ 14 октября 2019

Я создал простую (2.1.8) модель, которая работает с некоторыми метками, такими как данные, время, координаты, звезды ...

enter image description here

теперь я хочу видеть все метрики, связанные с каждой сущностью, использующей spacy. что-то вроде этого


           precision    recall  f1-score   support

  B-LOC      0.810     0.784     0.797      1084
  I-LOC      0.690     0.637     0.662       325
 B-MISC      0.731     0.569     0.640       339
 I-MISC      0.699     0.589     0.639       557
  B-ORG      0.807     0.832     0.820      1400
  I-ORG      0.852     0.786     0.818      1104
  B-PER      0.850     0.884     0.867       735
  I-PER      0.893     0.943     0.917       634

Я заметил, что для этого могу использовать Scorer:

https://spacy.io/api/scorer

Я пишу что-то вроде этого

scorer = nlp.evaluate(docs_golds, verbose=True)
print(scorer.scores)

но я не знаю, как сделать "документы-золото" из моего текста? У меня есть данные в формате JsonL, а также прочитал данные в виде текста в моей записной книжке, а затем использовал мою модель для NER следующим образом:

doc=nlp(str1)

. Есть ли у вас какие-либо идеи, как я могу решить эту проблему и вообще, что вы рекомендуете? чтобы показать производительность моей модели, у меня есть точность, но, конечно, точности не достаточно для выполнения любой задачи?

Я прочитал это

Есть ли способ с NER spaCy для расчета показателейпо типу сущности?

но я хочу сделать это по просторам. Кажется, это возможно в просторной 2

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...