Параметр terminceDelimiter не работает при использовании Stanford nndep Parser в командной строке - PullRequest
0 голосов
/ 22 февраля 2019

Параметр terminceDelimiter не работает во время использования анализатора Stanford nndep.

Команда:

java -classpath stanford-parsing -mx2000m \
    edu.stanford.nlp.parser.nndep.DependencyParser \
    -model nndep/english_UD.gz \
    -outputFormatOptions includePunctuationDependencies \
    -tagger.model stanford-postags/models/english-left3words-distsim.tagger \
    -textFile srcinput.txt \
    -outFile srcinput.dependence \
    -sentenceDelimiter newline

Анализатору не удается разделить предложение.Если значение -sentenceDelimiter равно $ '\ n', команда может работать, даже если она не будет выполнена, если запустить команду с setsid в linux.

1 Ответ

0 голосов
/ 26 февраля 2019

Я бы порекомендовал просто запустить конвейер с полной загрузкой Stanford CoreNLP.

Вы можете получить полный пакет здесь: https://stanfordnlp.github.io/CoreNLP/

Пример команды:

java -Xmx4g edu.stanford.nlp.pipeline.StanfordCoreNLP -annotators tokenize,ssplit,pos,lemma,depparse -ssplit.eolonly -file example.txt
...