CoreNLP Часть речевого глагола - PullRequest
0 голосов
/ 13 февраля 2019

Я пытаюсь выполнить pos-теги для общей фразы.

Используя этот код, в соответствии с глаголом, мне возвращается только «V», но я также хотел бы получить конкретную информацию о глаголе (например, время, человек и т. Д.).

Как получить конкретную информацию (VB, VBG, VBD, ecc) о теге?

void partOfSpeach(String s) throws IOException{
TintPipeline pipeline = new TintPipeline();
Properties props;
props = new Properties();
props.setProperty("annotators", "ita_toksent , ita_lemma , pos, ner, parse");
props.setProperty("pos.model", "models/italian-big.tagger");
props.setProperty("ita_toksent.model", "/Users/alessio/Desktop/token-settings.xml");
props.setProperty("customAnnotatorClass.ita_toksent", "eu.fbk.dh.tint.tokenizer.annotators.ItalianTokenizerAnnotator");
pipeline.loadDefaultProperties();
pipeline.load();
Annotation stanfordAnnotation = pipeline.runRaw(s);
List<CoreMap> sentences = stanfordAnnotation.get(SentencesAnnotation.class);
        for (CoreMap sentence : sentences) {            for (CoreLabel token : sentence.get(TokensAnnotation.class)) {
                String word = token.get(TextAnnotation.class);
                String pos = token.get(PartOfSpeechAnnotation.class);
                System.out.println(word + " " + pos);           }           }   }

Вывод: Ciao (I) Соно (V) Франческо (SP) Эд (CC) Хо (V) 24 (N) Анни (S)

...