Настройка SUTime для StanfordNLP в испанском sh - Java - PullRequest
0 голосов
/ 03 апреля 2020

У меня проблемы с настройкой SUTime в испанской версии sh, которая входит в stanford-spani sh -corenlp-2018-10-05-models.jar

В документах Стэнфорда говорится, что опции ner.applyNumericClassifiers = true и ner.useSUTime = true действительны только для версии Engli sh, но в банку spani sh входит spani sh .sutime.txt включено, и я хотел бы, чтобы это работало.

Я пытался с этим кодом:

Properties props = new Properties();
props.put("annotators", "tokenize, ssplit, pos, lemma, ner");

props.setProperty("tokenize.language", "es");
...         
...
props.setProperties("sutime.rules", "edu/stanford/nlp/models/sutime/spanish.sutime.txt");

Я действительно не знаю, как двигаться дальше, и я не видел этой проблемы ни в одном другом вопросе, возможно, кто-то может мне помочь.

1 Ответ

0 голосов
/ 14 апреля 2020

Spani sh будет запускать SUTime по умолчанию 3.9.2. Вы можете просто использовать эти свойства:

ner.model = edu/stanford/nlp/models/ner/spanish.ancora.distsim.s512.crf.ser.gz
ner.applyNumericClassifiers = true
ner.useSUTime = true
ner.language = es

Вы можете получить свойства Spani sh по умолчанию с:

Properties props = LanguageInfo.getLanguageProperties("spanish");
...