Я новичок в Spacy. Я использую Spacy Matcher для извлечения слов из предложений.
1) Я хочу извлечь фразы вроде: NOUN is ADJ and ADJ
с обоими прилагательными, извлеченными в промежутке. Я использую шаблон ниже
pattern = [
{"POS": "NOUN"},
{"POS": {"IN": ["AUX", "VERB"]}},
{"POS": "ADJ", "OP": "?"},
{"TEXT": {"REGEX": "(and)\s\w+"}, "OP": "?"},
]
для предложения типа Шар круглый и красный. Но я получаю только шар круглый . Я хочу, чтобы шар был круглым и красным .
2) Я также хочу получить лучшие результаты, такие как {"ball": ["round", "red"]}
, извлеченные из предложения выше. Есть ли хороший способ сделать это? Я использовал word.pos_
для каждого word
в Span
, чтобы найти NOUN
и ADJ
, но это кажется немного медленным.
Большое спасибо.