Я использую существительное чанкер spaCy (v2.2.3), но я не уверен, предназначен ли выход, созданный инструментом:
import spacy
nlp = spacy.load("en_core_web_sm")
doc = nlp(u'The girl really loved the black barock-styled house in the suburbs.')
for chunk in doc.noun_chunks:
print(chunk.root.left_edge.i, chunk.root.right_edge.i, chunk.text)
Результат:
0 1 The girl
4 12 the black barock-styled house
11 12 the suburbs
Вторая строка кажется неправильной, индексный диапазон слишком широкий или слишком короткий вывод chunk.text. Я не уверен, что мои ожидания неверны или результат работы инструмента. Может кто-нибудь уточнить, если это неправильное поведение?