Можно ли дать входной набор именованных объектов, а также набор предложений для coreNLP для разрешения coreference - PullRequest
0 голосов
/ 03 января 2019

Я пытаюсь выполнить сопоставление ссылок для набора данных, однако распознаватель именованных объектов Стэнфорда не может правильно классифицировать именованные объекты в моем наборе текста. Таким образом, возможно ли предоставить в модуль со-ссылки Stanford набор именованных сущностей и текст из другого NER, такого как NLTK, поскольку из моих исследований до сих пор кажется, что вы не можете разделить конвейер, когда он выполняет coref? В идеале я мог бы использовать stanfords NER, а затем обновить его, используя мои именованные сущности из другого NER, прежде чем передавать его в модуль coref. Любая помощь будет принята с благодарностью.

В настоящее время я делаю все это на Python, поэтому я протестировал множество оболочек Python для stanfordcoreNLP, каждая из которых, похоже, имеет только опцию catch all для создания coref, что делает невозможным достижение того, что мне нужно. Я также просмотрел документацию по coreNLP и не смог найти четкого ответа на вопрос, возможно ли это даже в Java или на сервере.

1 Ответ

0 голосов
/ 19 февраля 2019

Я использовал файл дополнительных правил TokensRegexNER из аннотатора Stanford CoreNLP «Распознавание именованных сущностей».По сути, вы создаете файл с разделителями табуляции с вашим набором именованных сущностей.

https://stanfordnlp.github.io/CoreNLP/ner.html#additional-tokensregexner-rules

Я не смог сделать это изнутри nltk, но я использовал тот же Stanford CoreNLP, что и в nltk.конвейер java для передачи файла правил в jar CoreNLP (с помощью опции -ner.additional.regexner.mapping).Я углубился в свой ответ здесь: Как передать CoreNLP некоторые предварительно помеченные именованные объекты? .Я предполагаю, что было бы просто встроить объект в nltk, который поддерживает эту функцию, так как большая часть обработки CoreNLP в nltk реализована как производные объекты, которые просто конструируются с набором переключателей опций CoreNLP.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...