Я работаю над извлечением дательного и прямого объекта с помощью Spacy. Существительные уже имеют теги зависимостей для своих корней, таких как dative
и dobj
, и я пытаюсь получить Span
и сохранить его как Do c, чтобы применить дальнейший анализ.
У меня есть следующий код:
import spacy
nlp = spacy.load("en_core_web_lg")
doc = nlp(open("/-textfile").read())
пока все хорошо, затем я получил объекты Span;
datives = []
for dat in doc.noun_chunks:
if dat.root.dep_ == "dative" and dat.root.head.pos_ == "VERB":
dative.append(dat.sent)
Теперь у меня есть все предложения с noun.chunks
, корни которых являются дативными, а голова - VERB
Однако я хотел бы получить token
данные, подобные datives []
dativesent = datives.as_doc()
Но проблема в том, что datives []
уже список, я не могу преобразовать его в DOC
.
Как я могу сохранить предложения с dative-noun.chunks как DOC?