Как получить обучающие данные и модели Stanford CoreNLP? - PullRequest
0 голосов
/ 02 ноября 2019

Я загрузил Stanford CoreNLP с официального сайта и GitHub .

В руководствах указано

На станках Stanford NLP обучающие данные доступны в / u / nlp / data / depparser / nn /данные

или ЗДЕСЬ

Список распределенных моделей:

edu / stanford / nlp / models / parser/nndep/english_UD.gz (по умолчанию, английский, универсальные зависимости)

Это может показаться глупым вопросом, но я не могу найти такие файлы и папки в любом дистрибутиве.

Где можноЯ нахожу исходные данные и модели, официально распространяемые с помощью Stanford CoreNLP?

1 Ответ

1 голос
/ 04 ноября 2019

Мы не распространяем большую часть обучающих данных CoreNLP. Довольно часто это несвободные, лицензированные данные, создаваемые другими людьми (например, LDC https://www.ldc.upenn.edu/).

. Однако, в рамках проекта Universal Dependencies доступно огромное количество бесплатных банков зависимостей: https://universaldependencies.org/.

Все модели Stanford CoreNLP доступны в jar-файлах "models". Edu / stanford / nlp / models / parser / nndep / english_UD.gz находится в этом: stanford-corenlp-3.9.2-models.jar, что одновременнов zip-файле скачайте http://nlp.stanford.edu/software/stanford-corenlp-full-2018-10-05.zip или можно найти на Maven здесь: http://central.maven.org/maven2/edu/stanford/nlp/stanford-parser/3.9.2/.

...