Стэнфордский POS-тегер на Java - PullRequest
       26

Стэнфордский POS-тегер на Java

1 голос
/ 23 декабря 2009

Я пытаюсь это:

Sentence<TaggedWord> taggedString = MaxentTagger.tagStringTokenized("here is a string to tag");

, что дает мне:

* +1006 * Ошибка: \ u \ nlp \ data \ pos-tagger \ wsj3t0-18-left3words \ left3words-wsj-0-18.tagger (системе не удается найти путь указано)

Я использую Stanford's POS tagger .

Что я могу сделать, чтобы преодолеть эту проблему?

Ответы [ 2 ]

4 голосов
/ 24 декабря 2009

Кажется, вам сначала нужно создать экземпляр тегера, передающего включенный файл:

new MaxentTagger("models/left3words-wsj-0-18.tagger");

Что довольно неприятно, так как метод тегирования, используемый позже, является статическим:

MaxentTagger.tagStringTokenized("here is a string to tag");

Мне также нужно было передать -Xmx256m, чтобы запустить его с этой настройкой.

2 голосов
/ 23 декабря 2009

Он говорит, что не может найти этот путь. Итак, существует ли он на вашей машине?

Обратите внимание, что косая черта является обратной косой чертой - поддерживает ли ваша ОС обратную косую черту как разделитель файлов?

Также обратите внимание, что это абсолютный путь - это предназначено?

Если все остальное в порядке, файл существует?

Редактировать: если нет, загрузите его здесь (http://github.com/tiendung/ruby-nlp/blob/master/left3words-wsj-0-18.tagger), поместите его в путь, указанный системой, и посмотрите, что произойдет.

...