Я пытаюсь использовать модуль nltk в python для объединения воедино любых случаев, когда в последовательности встречаются от двух до пяти существительных.
Это код, который я использую:
parse_pattern = "Keyword: {< N>{2,5}}"
keyword_parser = nltk.RegexpParser(parse_pattern)
result = keyword_parser.parse(sentence)
Я понимаю, что этот бит должен помочь: Keyword: {< N>{2,5}}
Я даже нашел пример в книге «Обработка естественного языка с Python», в которой вышеприведенный бит полностью аналогично используется: NOUNS: {< N.*>{4,}}
, где авторы объясняют, что этот бит кода должен содержать 4 или более существительных.
Однако я получаю сообщение об ошибке при запуске приведенного выше кода:
ValueError: Illegal chunk pattern: {< N>{2,5}}
Примечание: я также попробовал вышеупомянутое, используя {< N.*>{2,5}}
(с точечной звездой исключительно потому, что автор вышеупомянутой книги сделал) без удачи.
Любая помощь в том, как разбить два или более повторов тега, будет принята с благодарностью.