Я пытаюсь найти глаголы в предложении с python для проблемы НЛП. Я нашел старый ответ здесь на stackoverflow, и он работает с устаревшими pos_regex_matches. Использование новой функции совпадений у меня довольно скучная проблема. Новая функция возвращает любое совпадение, а не только самое длинное совпадение (что делает pos_regex_matches).
pattern = r'<VERB>*<ADV>*<VERB>+<PART>*'
verb_pattern = [{"POS": "VERB", "OP": "*"},{"POS": "ADV", "OP": "*"},{"POS": "VERB", "OP": "+"},{"POS": "PART", "OP": "*"}]
t_list_1 = textacy.extract.pos_regex_matches(text, pattern)
t_list_2 = textacy.extract.matches(text, verb_pattern)
Как вы можете видеть, шаблон такой же, но один из функций совпадений в новом формате. Старый pos_regex_matches возвращает, например, was celebrating
, в то время как новые совпадения возвращают и was
и was celebrating
. Кто-то сталкивался с такой же проблемой? Это проблема шаблона или текстового сообщения?
Заранее спасибо