Да, Matcher
ожидает вызова на Doc
объектах, а не Span
объектах.Но если вам нужно, вы можете использовать метод Span.as_doc
:
doc = nlp("Hello world. This is a text.")
span_doc = doc[0:3].as_doc()
print(span_doc.text) # 'Hello world.'
Обратите внимание, что это создаст копию содержимого , поэтомуобъект больше не является представлением родителя Doc
, а является совершенно отдельным объектом.В большинстве случаев это не должно иметь значения, но все же важно помнить.