Распознавание именованных сущностей NLTK с использованием корпуса Treebank - PullRequest
0 голосов
/ 07 сентября 2018

Я использую nltk для распознавания именованных объектов. Функция ne_chunk по умолчанию использует ACE Corpus для разбиения на фрагменты и именованного объекта.

chunked = ne_chunk (pos_tag (word_tokenize (text)))

Я хотел бы знать, есть ли способ использовать другой помеченный корпус, такой как корпус Treebank, для распознавания именованных объектов? Я знаю, что корпус дерева может быть импортирован

из дерева импорта nltk.corpus

Есть ли способ использовать этот корпус при поиске именованных объектов с помощью функции ne_chunk?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...