Вызов Stanford POS Tagger maxentTagger из Java-программы - PullRequest
2 голосов
/ 07 апреля 2010

Я новичок в Stanford POS tagger.

Мне нужно вызвать Tagger из моей Java-программы и направить вывод в текстовый файл. Я извлек исходные файлы из Stanford-postagger и попытался вызвать maxentTagger, но все, что я нашел, это ошибки и предупреждения.

Может кто-нибудь сказать мне с нуля о том, как вызвать maxentTagger в моей программе, при необходимости установить classpath и другие подобные шаги. Пожалуйста, помогите мне.

1 Ответ

3 голосов
/ 09 января 2011

Что ж, когда вы компилируете или запускаете свою программу, вам нужно добавить JAR-файл Стэнфорда в ваш путь к классам, например ::10000

java -classpath stanford-postagger.jar [MyProgram]

Тогда в вашем коде вам нужно будет импортировать соответствующие пакеты, большинство вещей, которые вам нужны, находятся в edu.stanford.nlp.tagger.maxent.

Создание нового MaxentTagger - это , хорошо описанное в JavaDoc , но некоторые из них я повторю здесь:

Чтобы создать новый тегер:

MaxentTagger tagger = new MaxentTagger("models/left3words-wsj-0-18.tagger");

Чтобы пометить String этим tagger:

String taggedString = tagger.tagString("Here's a tagged string.")

Кроме того, вы можете создавать и маркировать предложения, используя инструменты НЛП Стэнфорда. Создайте предложение, прочитав файл, используя BufferedReader:

Sentence sentence = Sentence.readOneSentence(in); // in is a BufferedReader

Затем пометьте предложение как tagger:

Sentence taggedSentence = tagger.tagSentence(sentence);
...