Повторное использование параметров при обучении новой модели stanford-pos - PullRequest
0 голосов
/ 08 мая 2018

При обучении новой модели с помощью:

java -mx1g edu.stanford.nlp.tagger.maxent.MaxentTagger -props myPropertiesFile.prop

Предположим, модель, указанная в myPropertiesFile.prop, уже существует. Обучена ли новая модель с нуля, или она обучается, исходя из существующих параметров? Могу ли я получить контроль над тем, что делается в этой ситуации?

Некоторый контекст:

Я хотел бы сначала обучить тегер на очень большом корпусе не очень точно помеченных данных, а затем продолжить обучение на гораздо меньшем корпусе точных данных (так называемый warm start)

1 Ответ

0 голосов
/ 14 мая 2018

Будет построена новая модель с нуля. Насколько я знаю, нет функциональности для обучения модели на одном наборе данных, а затем продолжения обучения на другом наборе данных. Вы можете изменить код так, чтобы он принимал начальные функции и веса, а затем начать обучение, но он не настроен так, чтобы это было легко.

...