Я использую nltk для распознавания именованных объектов. Функция ne_chunk по умолчанию использует ACE Corpus для разбиения на фрагменты и именованного объекта.
chunked = ne_chunk (pos_tag (word_tokenize (text)))
Я хотел бы знать, есть ли способ использовать другой помеченный корпус, такой как корпус Treebank, для распознавания именованных объектов? Я знаю, что корпус дерева может быть импортирован
из дерева импорта nltk.corpus
Есть ли способ использовать этот корпус при поиске именованных объектов с помощью функции ne_chunk?