Syntacti c извлечение зависимостей с помощью SpaCy? - PullRequest
0 голосов
/ 30 апреля 2020

У меня относительно большой корпус предложений, например:

Этот телефон качается. Это все, о чем я когда-либо мечтал. Вы можете go бегать с ним, плавать, делать что угодно. Он даже держит батарею очень хорошо. Тем не менее, я очень недоволен обслуживанием клиентов компанией, поэтому я не вернусь туда

В каждом предложении много информации, почему я пытаюсь использовать разбор зависимостей разбить предложения, потенциально имея возможность взвешивать каждое под-предложение на основе отношений.

Делая

sentence = nlp(text) #refers to the quote above
displacy.serve(sentence, style = 'dep')

, я получаю хорошую визуализацию, такую ​​как дерево разбора:

enter image description here

Однако Я испытываю большие трудности с обходом этого дерева разбора и осмысленным разделением отзывов.

У меня есть следующее:

for chunk in sentence.noun_chunks:
    print(chunk.text)

Какие выходные данные:

This phone rocks 

It

everything
I
You
it
it
what
It
battery
I
the customer service
the company
I

TL;DR:

Как я могу эффективно пройти по дереву, чтобы вычесть значимые синтактические c зависимости, такие как:

'This phone rocks', 'it is everything I have ever dreamed of', However, I am very displeased with the customer service by the company, so I won't be coming back there
...