Параметр Stanford coreNLP output.printSingletonEntities не работает - PullRequest
0 голосов
/ 12 февраля 2020

Я использую coreNLP для разрешения coreference из командной строки. Мне нужна система для аннотирования синглетонов (отдельных упоминаний), чтобы иметь возможность оценивать вывод моих данных, в котором они аннотированы. Я знаю, что система была обучена на Ontonotes, у которой нет синглетонов, но я нашел этот параметр output.printSingletonEntities , который, как я предполагаю, должен добавить аннотацию синглетонов некоторым heuristi c способом.

output.printSingletonEntities: Boolean. Следует ли печатать упоминания одноэлементных сущностей в выводе coreference.

Однако добавление его в файл параметров абсолютно ничего не изменило. Что я делаю не так?

Это мой файл параметров:

annotators = tokenize, ssplit, pos, lemma, ner, parse, coref

tokenize.whitespace = true

tokenize.options = tokenizePerLine

ssplit.newlineIsSentenceBreak = всегда

coref.algorithm = neural

filelist = / Users / veronika / Dropbox / data / preprocessing / filelist.txt

output.printSingletonEntities = true


Я также пытался вызвать его непосредственно из командной строки, но аннотация остается то же самое.

java -cp "" -Xmx10g edu.stanford.nlp.pipeline.StanfordCoreNLP -props /Users/veronika/Dropbox/data/sampleProps.properties - output.printSingletonEntities true *

Заранее благодарим вас за советы!

1 Ответ

0 голосов
/ 17 февраля 2020

Я думаю, вам нужно добавить -coref.removeSingletonClusters false в ваши настройки.

...