Что ж, когда вы компилируете или запускаете свою программу, вам нужно добавить JAR-файл Стэнфорда в ваш путь к классам, например ::10000
java -classpath stanford-postagger.jar [MyProgram]
Тогда в вашем коде вам нужно будет импортировать соответствующие пакеты, большинство вещей, которые вам нужны, находятся в edu.stanford.nlp.tagger.maxent
.
Создание нового MaxentTagger
- это , хорошо описанное в JavaDoc , но некоторые из них я повторю здесь:
Чтобы создать новый тегер:
MaxentTagger tagger = new MaxentTagger("models/left3words-wsj-0-18.tagger");
Чтобы пометить String
этим tagger
:
String taggedString = tagger.tagString("Here's a tagged string.")
Кроме того, вы можете создавать и маркировать предложения, используя инструменты НЛП Стэнфорда. Создайте предложение, прочитав файл, используя BufferedReader
:
Sentence sentence = Sentence.readOneSentence(in); // in is a BufferedReader
Затем пометьте предложение как tagger
:
Sentence taggedSentence = tagger.tagSentence(sentence);