В настоящее время я работаю над анализом текста и использую Stanford-CoreNLP 3.9.1.
Вот мой код:
Properties properties = new Properties();
properties.put("annotators", "tokenize,ssplit,truecase,pos,lemma");
properties.put("truecase.overwriteText", "true");
StanfordCoreNLP pipeline = new StanfordCoreNLP(properties);
Annotation document = new Annotation(myText);
pipeline.annotate(document);
Когда я выполняю этот код на тексте
НИКОГДА НЕ ИСПОЛЬЗУЙТЕ ЭТИ МАТЕРИАЛЫ ПРИ ИСКЛЮЧЕНИИ ИСКРА ИЛИ ИСТОЧНИКОВ ТЕПЛА.
или
Не смешивайте смазки между ними.
«ИСКРЫ» и «смазки» помечены как VBZ (глагол, присутствует от третьего лица) вместо NNS (существительное, множественное число).
Есть ли конфигурация для решения этой проблемы?
Спасибо.