Как использовать Stanford NLP API для получения фраз или токенов из запроса NL? - PullRequest
0 голосов
/ 23 сентября 2010

Мне нужны фразы, возвращаемые из анализатора Stanford для использования в моей программе.

1 Ответ

0 голосов
/ 25 сентября 2010

Вы просто хотите токены (слова)?Если это так, вы хотите что-то вроде:

Reader r; // initialized somehow by you
Tokenizer<CoreLabel> tokenizer = new PTBTokenizer<CoreLabel>(r, new CoreLabelTokenFactory(), "");
while (tokenizer.hasNext()) {
  CoreLabel token = tokenizer.next();
  System.out.println(token);
}

Или вы хотите фразы в дереве разбора?Если это так, вы должны получить возвращенное Дерево как в ParserDemo в дистрибутиве и использовать в нем фразы (поддеревья) (вы можете перебирать их:

Tree parse = lp.apply(sentence);
for (Tree subtree : tree) {
  System.out.println(subtree);
}
...