Поиск имен людей и организаций с помощью регулярных выражений (python) - PullRequest
0 голосов
/ 02 февраля 2019

В книге «Обработка естественного языка с Python.есть упражнение: токенизировать все имена людей и организаций, используя nltk.regexp_tokenize ()

Проблема: функция возвращает первые слова в предложении, которые могут быть как желательным, так и нежелательным.

Вопрос: как сделать этот поиск более конкретным?В моем случае я использую следующую схему: '[AZ] [az] +'

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...