Данные обучения для обновления существующей модели Spacy NER - PullRequest
0 голосов
/ 03 августа 2020

Я пытаюсь обновить существующую модель Spacy NER нашими собственными данными. У меня есть несколько вопросов. Я очень благодарен за любые подсказки, предложения или объяснения.

Допустим, существующая модель Spacy German NER делает это с помощью одной отправки наших данных:

  1. Поскольку модель ошибочно классифицирует «GIZ» (организацию) как «MIS C», я заменю ее на ORG. Модель ошибочно классифицирует EZ-Programm как ORG. То же самое и со словом Abkürzungsverzeichnis. Я могу удалить оба кортежа или исправить их класс (например, на «MIS C»). Моя интуиция подсказывает, что лучше бы их классы поправить. Каковы лучшие практики в такой ситуации?

TIA, Sharif

...