Использует ли OpenNLP WordNet под капотом для распознавания именованных объектов - PullRequest
1 голос
/ 28 апреля 2011

Я пытался использовать OpenNLP Tools 1.5 от SourceForge для получения именованных объектов из текста.Я нашел файл JWNL в загрузке OpenNLP.Означает ли это, что OpenNLP в свою очередь использует WordNet для распознавания именованных объектов.(В частности, означает ли это, что файлы Name Model были созданы с помощью WordNet)?

Ответы [ 2 ]

2 голосов
/ 28 апреля 2011

Нет, OpenNLP использует WordNet только для разрешения сопутствующих ссылок, например, сопоставление «Он» со «Стивом Джонсом» в отдельных предложениях.

WordNet не используется в распознавании именованных объектов.Обучающие файлы именованных объектов представляют собой аннотированные вручную поля из различных конференций / тестов, таких как CoNLL.

Источник: http://opennlp.sourceforge.net/README.html

2 голосов
/ 28 апреля 2011

Как я знаю, OpenNLP использует пакет максимальной энтропии для предоставления всех своих статистических моделей - pos-тегирование, обнаружение предложений, NER и даже токенизация. Интеграция Wordnet не является частью OpenNLP, поэтому я думаю, что ее функции не использовались в моделях обучения.

...