Поиск текста по геонам - PullRequest
2 голосов
/ 03 апреля 2010

какую часть огромного пакета nltk я должен изучить и использовать, если мне нужно пометить географические названия в тексте?

1 Ответ

2 голосов
/ 03 апреля 2010

Вы захотите использовать их именованный распознаватель сущностей nltk.ne_chunk .

После того, как текст помечен, вам нужно искать фразы, помеченные как LOC (местоположение) и GPE (геополитическая сущность).

...