SpaCy - существительные промежутки чанкера кажутся неправильными - PullRequest
0 голосов
/ 12 марта 2020

Я использую существительное чанкер spaCy (v2.2.3), но я не уверен, предназначен ли выход, созданный инструментом:

import spacy
nlp = spacy.load("en_core_web_sm")
doc = nlp(u'The girl really loved the black barock-styled house in the suburbs.')

for chunk in doc.noun_chunks:
    print(chunk.root.left_edge.i, chunk.root.right_edge.i, chunk.text)

Результат:

0 1 The girl
4 12 the black barock-styled house
11 12 the suburbs

Вторая строка кажется неправильной, индексный диапазон слишком широкий или слишком короткий вывод chunk.text. Я не уверен, что мои ожидания неверны или результат работы инструмента. Может кто-нибудь уточнить, если это неправильное поведение?

...