Есть ли оператор OR в шаблонах Matcher? - PullRequest
0 голосов
/ 21 ноября 2018

Как с помощью spaCy 2.x извлечь словосочетания на основе частей речи?Я хочу использовать шаблоны с Matcher в spaCy, но комбинаций слишком много, чтобы создавать их вручную.

Действительно, в моей логике существительная фраза - это группа из одного или нескольких токенов, которые:

  • должен заканчиваться токеном NOUN
  • может также содержать ноль, один или несколько токенов ADJ, PROPN, NOUN в любом порядке перед конечным токеном NOUN

Например:

  • NOUN ADJ NOUN
  • NOUN
  • ADJ ADJ NOUN NOUN

Есть ли оператор "ИЛИ", чтобы я мог использовать шаблоннапример, приведенный ниже (например, с использованием массива соответствующих POS)?

matcher.add(

    'NounPhrases', 
    None, 
    [
        {'POS': ['ADJ','NOUN','PROPN'], 'OP': '*'},
        {'POS': 'NOUN'}
    ]
)
...