Я создал объект Doc
из пользовательского списка токенов в соответствии с документацией:
import spacy
from spacy.tokens import Doc
nlp = spacy.load("my_ner_model")
doc = Doc(nlp.vocab, words=["Hello", ",", "world", "!"])
Как мне теперь записывать теги именованных сущностей в doc
с моей моделью NER сейчас?
Я пытался сделать doc = nlp(doc)
, но у меня не получилось поднять TypeError
.
Я не могу просто объединить свой список слов в простой текст, чтобы сделать doc = nlp(text)
как обычно, потому что в этом случае spaCy
разделяет некоторые слова в моих текстах на два токена, которые я не могу принять.