Regex для Spacy Matcher - PullRequest
       6

Regex для Spacy Matcher

0 голосов
/ 05 марта 2020

Я новичок в Spacy. Я использую Spacy Matcher для извлечения слов из предложений.

1) Я хочу извлечь фразы вроде: NOUN is ADJ and ADJ с обоими прилагательными, извлеченными в промежутке. Я использую шаблон ниже

pattern = [
    {"POS": "NOUN"},
    {"POS": {"IN": ["AUX", "VERB"]}},
    {"POS": "ADJ", "OP": "?"},
    {"TEXT": {"REGEX": "(and)\s\w+"}, "OP": "?"},
]

для предложения типа Шар круглый и красный. Но я получаю только шар круглый . Я хочу, чтобы шар был круглым и красным .

2) Я также хочу получить лучшие результаты, такие как {"ball": ["round", "red"]}, извлеченные из предложения выше. Есть ли хороший способ сделать это? Я использовал word.pos_ для каждого word в Span, чтобы найти NOUN и ADJ, но это кажется немного медленным.

Большое спасибо.

...