nltk.tree fromstring () анализирует в неправильном порядке - PullRequest
0 голосов
/ 10 февраля 2020

Я пытаюсь использовать nltk.tree.Tree с его fromstring() методом. Мой вариант использования состоит в том, что я хочу только дерево, которое имеет 1 уровень вложенности, например, для предложения:

Mr. Vinken is chairman of Elsevier N.V., the Dutch publishing group.

Я хочу разобрать деревья структур:

(S Mr. Vinken is chairman of Elsevier N.V., (SubS the Dutch publishing group).)
(S Mr. Vinken is chairman (SubS of Elsevier) N.V., the Dutch publishing group.)

И т. Д.

Однако, когда я пытаюсь использовать nltk.tree.Tree.fromstring() в вышеупомянутых строках, поддеревья неправильно выдвигаются до конца:

                               S                                             
  _____________________________|_______________________                       
 |    |     |     |      |     |       |    |        SubS                 
 |    |     |     |      |     |       |    |    ______|__________________    
Mr. Vinken  is chairman  of Elsevier N.V.,  .  the   Dutch   publishing group
                               S                                                
  _____________________________|__________________________________               
 |    |     |     |       |    |    |       |        |          SubS         
 |    |     |     |       |    |    |       |        |      ______|________      
Mr. Vinken  is chairman N.V., the Dutch publishing group.  of           Elsevier

Как мне отформатировать строка, чтобы я мог получить дерево с правильным порядком поддеревьев?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...