Как с помощью spaCy 2.x извлечь словосочетания на основе частей речи?Я хочу использовать шаблоны с Matcher
в spaCy, но комбинаций слишком много, чтобы создавать их вручную.
Действительно, в моей логике существительная фраза - это группа из одного или нескольких токенов, которые:
- должен заканчиваться токеном NOUN
- может также содержать ноль, один или несколько токенов
ADJ, PROPN, NOUN
в любом порядке перед конечным токеном NOUN
Например:
NOUN ADJ NOUN
NOUN
ADJ ADJ NOUN NOUN
Есть ли оператор "ИЛИ", чтобы я мог использовать шаблоннапример, приведенный ниже (например, с использованием массива соответствующих POS)?
matcher.add(
'NounPhrases',
None,
[
{'POS': ['ADJ','NOUN','PROPN'], 'OP': '*'},
{'POS': 'NOUN'}
]
)