Я пытаюсь обновить существующую модель Spacy NER нашими собственными данными. У меня есть несколько вопросов. Я очень благодарен за любые подсказки, предложения или объяснения.
Допустим, существующая модель Spacy German NER делает это с помощью одной отправки наших данных:
- Поскольку модель ошибочно классифицирует «GIZ» (организацию) как «MIS C», я заменю ее на ORG. Модель ошибочно классифицирует EZ-Programm как ORG. То же самое и со словом Abkürzungsverzeichnis. Я могу удалить оба кортежа или исправить их класс (например, на «MIS C»). Моя интуиция подсказывает, что лучше бы их классы поправить. Каковы лучшие практики в такой ситуации?
TIA, Sharif