Я обучил синтаксический анализатор сдвига в Стэнфорде с помощью корпуса WSJ, который содержит функциональные теги, такие как -TMP. Затем я протестировал обученную модель, но теги -TMP выводятся на уровне POS дерева (NP (каждый DT) (год NN-TMP)) вместо уровня NP (NP-TMP (каждый DT) (NN). год)).
Это командная строка, которую я использовал для обучения модели:
java -mx10g edu.stanford.nlp.parser.shiftreduce.ShiftReduceParser -trainTreebank / my_corpus / wsj - 8 -serializedPath SR_model.ser.gz
И это командная строка, которую я использовал для проверки модели:
java -mx6g edu.stanford.nlp.parser.shiftreduce.ShiftReduceParser -testTreebank / my_corpus / test -taggerSerializedFile coreNlpPos.model -tlpp edu.stanford.nlp.parser.lexparub.serserP > output.txt
В файле output.txt есть теги -TMP, но все они находятся в теге POS, например, NN-TMP, IN-TMP, например
(S
(PP (IN-TMP более)
(NP
(NP (DT the) (JJ мимо) (CD девять) (NNS месяцев))
(,,)
...
но я ожидал, что это будет как NP-TMP, PP-TMP и т. Д.
Например
(S
(PP-TMP (IN Over)
(NP
(NP (DT the) (JJ мимо) (CD девять) (NNS месяцев))
(,,)
...
Как мне изменить параметр обучения / параметр тестирования в командной строке, чтобы получить ожидаемый результат?