Я пытаюсь сделать стемминг, используя класс Stemmer из Stanford Core NLP (https://github.com/stanfordnlp/CoreNLP/blob/master/src/edu/stanford/nlp/process/Stemmer.java).
Я пытаюсь вызвать метод стеммера (который я немного отредактировал) из другого класса, как показано ниже, обратите внимание, что term - это строка:
term
String stemmedterm=CoreNLPKeyPhraseStemmer.keystemming(term);
Основная работа по выделению в методе CoreNLPKeyPhraseStemmer keystemming выполняется следующей строкой:
keystemming
String s1= s.stem(token.word());
Однако моя проблема в том, что тип token должен быть Word ieedu.stanford.nlp.ling.Word (https://nlp.stanford.edu/nlp/javadoc/javanlp/index.html?edu/stanford/nlp/ling/Word.html), когда я предоставляю String при вызове keystemming из другого класс. Есть ли способ преобразовать предоставленную строку в Word?
token
Word
Читая код для класса Word, он, кажется, поддерживает String в своем конструкторе, поэтому я считаю, что вам просто нужно сделать
String
Word(token.stem())
, чтобы получить объект слова для токена-основы.