Получить предыдущие и последующие предложения в spaCy - PullRequest
0 голосов
/ 29 октября 2019

Я использую spaCy для обработки предложений документа. Учитывая одно предложение, я хотел бы получить предыдущее и следующее предложение.

Я могу легко перебирать предложения документа следующим образом:

nlp_content = nlp(content)
sentences = nlp_content.sents
for idx, sent in enumerate(sentences):

Но я не могу получить предложение # idx-1 или # idx + 1 из предложения #idx.

Есть ли какая-либо функция или свойство, которые могут быть там полезны?

Спасибо!

Ник

1 Ответ

0 голосов
/ 29 октября 2019

Нет встроенного индекса предложения. Вам нужно будет выполнить итерации по предложениям один раз, чтобы создать собственный список диапазонов предложений, чтобы получить к ним доступ таким образом.

sentence_spans = tuple(doc.sents) # alternately: list(doc.sents)
...