У меня есть список предложений, которые я преобразовал в pos-теги, такие как:
tags =
[['DET', 'ADJ', 'NOUN', 'VERB', 'ADP', 'ADJ', 'ADJ', 'NOUN', 'ADP','DET', 'NOUN', 'ADJ', 'AUX', 'PUNCT']
['DET','NOUN', 'VERB', 'ADP', 'ADJ', 'ADJ', 'NOUN', 'ADP', 'DET','NOUN', 'PUNCT']]
Я пытаюсь создать регулярное выражение, например:
- один DET дляначало
- ноль или один ADJ следующий
- один NOUN следующий
- один VERB следующий
- Все остальное между
- конечная позиция должна бытьодин НОУН, за которым следует ПУНКТ
Так, например, он будет исключать:
['DET','NOUN', 'VERB', 'ADP', 'ADJ', 'ADJ', 'NOUN', 'ADP', 'DET','NOUN', 'PUNCT']
['DET','ADJ', 'NOUN', 'VERB', 'DET', 'NOUN', 'ADP', 'DET','NOUN', 'PUNCT']
, но не примет:
['DET', 'ADJ', 'NOUN', 'VERB', 'ADP', 'ADJ', 'ADJ', 'NOUN', 'ADP','DET', 'NOUN', 'ADJ', 'AUX', 'PUNCT']
['ADJ', 'NOUN', 'VERB', 'ADP', 'AUX', 'PUNCT']
Возможно ли это?