Почему выходной сигнал отличается при смене испанской модели?
Можно ли увидеть «старый» вывод с новой моделью?
Я скачал свежую версию Stanford Core NLP и скачал последнюю модель синтаксического анализатора для испанского языка stanford-spanish-corenlp-2018-10-05-models.jar
.
Затем я запускаю этот код:
from nltk.parse.corenlp import CoreNLPParser
Parser = CoreNLPParser(url='http://localhost:9000')
sentence = 'si idioma no es elegido entonces elegir español por defecto.'
result = Parser.raw_parse(sentence)
for item in result:
print(item)
Что дает следующее с новой испанской моделью :
(ROOT
(sentence
(sn
(grup.nom
(SCONJ si)
(NOUN idioma)
(NOUN no)
(AUX es)
(VERB elegido)
(ADV entonces)
(VERB elegir)
(ADJ español)
(ADP por)
(NOUN defecto)))
(PUNCT .)))
Однако, когда я заменяю новую модель синтаксического анализатора на более старую модель синтаксического анализатора (stanford-spanish-corenlp-2017-06-09-models.jar
), выходные данные отличаются при использовании старой испанской модели :
ROOT
(sentence
(S
(S
(conj (cs si))
(sn (grup.nom (nc0s000 idioma)))
(neg (rn no))
(grup.verb (vsip000 es)))
(S (participi (aq0000 elegido))))
(S
(sadv (grup.adv (rg entonces)))
(S
(infinitiu (vmn0000 elegir))
(s.a (grup.a (aq0000 español)))
(sp (prep (sp000 por)) (sn (grup.nom (nc0s000 defecto))))))
(fp .)))
Примечание: В обоих случаях я запускаю сервер Stanford, выполняя следующие действия:
java -mx3g -cp "*" edu.stanford.nlp.pipeline.StanfordCoreNLPServer -serverProperties StanfordCoreNLP-spanish.properties -port 9000 -timeout 15000