SpaCy: совпадение с Doc - PullRequest
       40

SpaCy: совпадение с Doc

0 голосов
/ 05 марта 2019

Я пытался использовать SpaCy Matcher для поиска span, но оказалось, что не могу.

 Argument 'doc' has incorrect type (expected spacy.tokens.doc.Doc, got spacy.tokens.span.Span)

Как я могу искать только частьdoc тогда?Есть ли простой способ конвертировать span в doc?

1 Ответ

0 голосов
/ 06 марта 2019

Да, Matcher ожидает вызова на Doc объектах, а не Span объектах.Но если вам нужно, вы можете использовать метод Span.as_doc:

doc = nlp("Hello world. This is a text.")
span_doc = doc[0:3].as_doc()
print(span_doc.text)  # 'Hello world.'

Обратите внимание, что это создаст копию содержимого , поэтомуобъект больше не является представлением родителя Doc, а является совершенно отдельным объектом.В большинстве случаев это не должно иметь значения, но все же важно помнить.

...