Я использую сопоставитель токенов SpaCy для извлечения предложений с определенной структурой, например, «Я хочу банан».
Теперь я использую шаблон, подобный этому, на основе POS-тегов:
pattern = [{"POS": "PRON"}, {"POS": "VERB"},{"POS": "NOUN"}]
Но в этом случае совпадение SpaCy ищет только буквальное совпадение, и я бы хотел, чтобы он искалпредложения, в которых эти токены находятся в заявленном порядке, но не обязательно один за другим. Например, шаблон должен найти предложение «Я хочу этот банан».
Мне нужен шаблон, который может сопоставить предложение с токенами, которые имеют необходимый порядок (как в шаблоне), но могут иметь другой токен между.