Я новичок в НЛП. Я пытаюсь найти корпус для части речи. Цель состоит в том, чтобы найти последовательность POS-тегов и найти все предложения, которые соответствуют последовательности из данного корпуса.
Вход: быстрая коричневая лиса перепрыгнула через ленивых собак. Tagger обработает тэг предложения: POS-тэгирование приводит к следующему: [DT] [JJ] [JJ] [NN] [VBD] [IN] [DT] [JJ] [NNS] [.] Применение поиска приведет к любому предложению, которое соответствует этой последовательности или дольше.
Как выполнить поиск по части речи? Есть ли прямая функция в NLTK или spacy?
Буду признателен за некоторые рекомендации о шагах, необходимых для решения проблемы и проблем, с которыми я могу столкнуться.
Обратите внимание, что я нашел кого-то, кто опубликовал похожий вопрос на stackoverflow, но я думаю, что проблема, с которой он столкнулся, была более конкретной c. Поиск POS