синтаксический анализатор пространственных зависимостей, обученный по пользовательской семантике, создает метку, а не данные обучения - PullRequest
0 голосов
/ 01 мая 2020

Я обучил пространственную модель для POS-тегов и меток зависимостей, причем метки зависимостей представляли собой пользовательский набор меток c. Когда я загружаю обученную модель через nlp = spacy.load('model-best'), а затем запускаю этот код:

for t in nlp("some input text string"):
    print(t.dep_)

я вижу, что в некоторых случаях появляется ярлык dep , хотя этот ярлык не является частью моего пользовательский словарь меток и, следовательно, отсутствует в данных обучения.

В настоящее время у меня есть только небольшой набор данных обучения, поэтому мне интересно, является ли это значением по умолчанию, которое выводится, когда модель не Достаточно уверенно установить один из пользовательских тегов?

Информация о spaCy

  • версия spaCy: 2.2.3
  • Платформа: Linux -4.4.0-18362-Microsoft-x86_64-with-debian-buster-sid
  • Python версия: 3.7.6
...