Я пытаюсь использовать nltk.tree.Tree
с его fromstring()
методом. Мой вариант использования состоит в том, что я хочу только дерево, которое имеет 1 уровень вложенности, например, для предложения:
Mr. Vinken is chairman of Elsevier N.V., the Dutch publishing group.
Я хочу разобрать деревья структур:
(S Mr. Vinken is chairman of Elsevier N.V., (SubS the Dutch publishing group).)
(S Mr. Vinken is chairman (SubS of Elsevier) N.V., the Dutch publishing group.)
И т. Д.
Однако, когда я пытаюсь использовать nltk.tree.Tree.fromstring()
в вышеупомянутых строках, поддеревья неправильно выдвигаются до конца:
S
_____________________________|_______________________
| | | | | | | | SubS
| | | | | | | | ______|__________________
Mr. Vinken is chairman of Elsevier N.V., . the Dutch publishing group
S
_____________________________|__________________________________
| | | | | | | | | SubS
| | | | | | | | | ______|________
Mr. Vinken is chairman N.V., the Dutch publishing group. of Elsevier
Как мне отформатировать строка, чтобы я мог получить дерево с правильным порядком поддеревьев?