Question

Я использую nltk для распознавания именованных объектов. Функция ne_chunk по умолчанию использует ACE Corpus для разбиения на фрагменты и именованного объекта.

chunked = ne_chunk (pos_tag (word_tokenize (text)))

Я хотел бы знать, есть ли способ использовать другой помеченный корпус, такой как корпус Treebank, для распознавания именованных объектов? Я знаю, что корпус дерева может быть импортирован

из дерева импорта nltk.corpus

Есть ли способ использовать этот корпус при поиске именованных объектов с помощью функции ne_chunk?

Распознавание именованных сущностей NLTK с использованием корпуса Treebank

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Распознавание именованных сущностей NLTK с использованием корпуса Treebank

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы