Типизированные зависимости для анализатора Stanford - PullRequest
1 голос
/ 26 сентября 2010

Типизированные зависимости, заданные Stanford parser online , и зависимости, сгенерированные с помощью указанного исходного кода, не совпадают.

Версии исходных кодов, доступные на веб-сайте Stanford, не генерируют сокращения,Принадлежащие и возможные теги.

Какую версию анализатора Stanford использовать для генерации этих тегов?

1 Ответ

4 голосов
/ 30 сентября 2010

Они одинаковы. Ответ состоял в том, что вы должны были вызвать парсер таким образом, чтобы вызвать токенизацию ввода. Вот некоторые примеры:

LexicalizedParser lp = LexicalizedParser.loadModel("edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz");
String sent = "This is one last test!";
lp.apply(sent).pennPrint();

или в более сложном сценарии:

TreebankLanguagePack tlp = lp.getOp().langpack();
Tokenizer<? extends HasWord> toke = tlp.getTokenizerFactory().getTokenizer(new StringReader(sent));
List<? extends HasWord> sentence = toke.tokenize();
lp.apply(sentence);
...