Как обучить и вывести «функциональные теги» со Стэнфордским сдвигом уменьшения парсера? - PullRequest
0 голосов
/ 05 апреля 2019

Я обучил синтаксический анализатор сдвига в Стэнфорде с помощью корпуса WSJ, который содержит функциональные теги, такие как -TMP. Затем я протестировал обученную модель, но теги -TMP выводятся на уровне POS дерева (NP (каждый DT) (год NN-TMP)) вместо уровня NP (NP-TMP (каждый DT) (NN). год)).

Это командная строка, которую я использовал для обучения модели:

java -mx10g edu.stanford.nlp.parser.shiftreduce.ShiftReduceParser -trainTreebank / my_corpus / wsj - 8 -serializedPath SR_model.ser.gz

И это командная строка, которую я использовал для проверки модели:

java -mx6g edu.stanford.nlp.parser.shiftreduce.ShiftReduceParser -testTreebank / my_corpus / test -taggerSerializedFile coreNlpPos.model -tlpp edu.stanford.nlp.parser.lexparub.serserP > output.txt

В файле output.txt есть теги -TMP, но все они находятся в теге POS, например, NN-TMP, IN-TMP, например

(S (PP (IN-TMP более) (NP (NP (DT the) (JJ мимо) (CD девять) (NNS месяцев)) (,,) ...

но я ожидал, что это будет как NP-TMP, PP-TMP и т. Д. Например

(S (PP-TMP (IN Over) (NP (NP (DT the) (JJ мимо) (CD девять) (NNS месяцев)) (,,) ...

Как мне изменить параметр обучения / параметр тестирования в командной строке, чтобы получить ожидаемый результат?

...