Предположим, что у нас есть:
[('The', 'DET'),
('red', 'ADJ'),
('window', 'NOUN'),
('is', 'VERB'),
('closed', 'VERB'),
('.', 'PUNCT')]
Это список кортежей, в котором их первый элемент является словом предложения (в данном случае, «Красное окно закрыто»), ивторая - это грамматическая категория (или тег).
Предположим, у нас есть следующее правило:
1.)
[('ADJ', 'NOUN'), ('NOUN', 'ADJ')]
Это говорит о том, что если у нас есть ADJ немедленноза ним следует NOUN (в данном примере «красный» и «окно»), мы должны изменить их порядок, чтобы сразу за ним следовал ADJ.Тогда результат применения правила 1 к предложению будет следующим:
[('The', 'DET'),
('window', 'NOUN'),
('red', 'ADJ'),
('is', 'VERB'),
('closed', 'VERB'),
('.', 'PUNCT')]
Кто-нибудь имеет представление о том, как автоматизировать это для любого числа других правил и предложений?Или даже какая-то базовая стратегия действительно поможет.
Буду признателен за любую помощь.