Как улучшить шаблон соответствия SpaCy - PullRequest
0 голосов
/ 13 октября 2019

Я использую сопоставитель токенов SpaCy для извлечения предложений с определенной структурой, например, «Я хочу банан».

Теперь я использую шаблон, подобный этому, на основе POS-тегов:

pattern = [{"POS": "PRON"}, {"POS": "VERB"},{"POS": "NOUN"}]

Но в этом случае совпадение SpaCy ищет только буквальное совпадение, и я бы хотел, чтобы он искалпредложения, в которых эти токены находятся в заявленном порядке, но не обязательно один за другим. Например, шаблон должен найти предложение «Я хочу этот банан».

Мне нужен шаблон, который может сопоставить предложение с токенами, которые имеют необходимый порядок (как в шаблоне), но могут иметь другой токен между.

1 Ответ

3 голосов
/ 13 октября 2019

Вы можете использовать {"OP": "*"}, чтобы сопоставить ноль или более токенов любого типа.

См. Все операторы здесь: https://spacy.io/usage/rule-based-matching#quantifiers

...