У меня относительно большой корпус предложений, например:
Этот телефон качается. Это все, о чем я когда-либо мечтал. Вы можете go бегать с ним, плавать, делать что угодно. Он даже держит батарею очень хорошо. Тем не менее, я очень недоволен обслуживанием клиентов компанией, поэтому я не вернусь туда
В каждом предложении много информации, почему я пытаюсь использовать разбор зависимостей разбить предложения, потенциально имея возможность взвешивать каждое под-предложение на основе отношений.
Делая
sentence = nlp(text) #refers to the quote above
displacy.serve(sentence, style = 'dep')
, я получаю хорошую визуализацию, такую как дерево разбора:
![enter image description here](https://i.stack.imgur.com/9qpU4.png)
Однако Я испытываю большие трудности с обходом этого дерева разбора и осмысленным разделением отзывов.
У меня есть следующее:
for chunk in sentence.noun_chunks:
print(chunk.text)
Какие выходные данные:
This phone rocks
It
everything
I
You
it
it
what
It
battery
I
the customer service
the company
I
TL;DR:
Как я могу эффективно пройти по дереву, чтобы вычесть значимые синтактические c зависимости, такие как:
'This phone rocks', 'it is everything I have ever dreamed of', However, I am very displeased with the customer service by the company, so I won't be coming back there