Определите английские времена глагола, используя NLTK - PullRequest
13 голосов
/ 08 августа 2010

Я ищу способ, с помощью которого в тексте английского языка встречаются глагольные фразы в прошедшем, настоящем и будущем временах.Сейчас я использую NLTK , делаю пометку POS (Part-Of-Speech), а затем считаю «VBD», чтобы пройти прошедшие времена.Это не достаточно точно, поэтому, я думаю, мне нужно пойти дальше и использовать чанкинг, а затем проанализировать фрагменты VP на предмет определенных временных паттернов.Есть ли что-нибудь существующее, что делает это?Любое дальнейшее чтение, которое может быть полезным?Книга NLTK в основном посвящена NP-чанкам, и я могу найти довольно мало информации о VP-чанках.

Ответы [ 2 ]

10 голосов
/ 09 августа 2010

Точный ответ зависит от того, какой блок вы намереваетесь использовать, но понимание списка займет у вас долгий путь. Это дает вам количество глагольных фраз, использующих несуществующий фрагмент.

len([phrase for phrase in nltk.Chunker(sentence) if phrase[1] == 'VP'])

Вы можете использовать более детальный подход для определения числа времен.

1 голос
/ 09 августа 2010

Вы можете сделать это с помощью Berkeley Parser или Stanford Parser .Но я не знаю, есть ли интерфейс Python для любого из них.

...