проблемы с импортом stanford pos tagger в nltk - PullRequest
1 голос
/ 08 сентября 2011

Это, наверное, очень тривиальный вопрос.Я пытаюсь использовать тег stanford pos через nltk, указанный здесь Проблема в том, что моя библиотека nltk не содержит модуль stanford.Поэтому я скопировал то же самое в соответствующую папку и скомпилировал то же самое.Теперь, когда я пытаюсь запустить пример, модуль обнаруживается, но не класс внутри модуля.Может кто-нибудь сказать мне, где я иду не так ??Опять же, это, вероятно, очень глупо.

>>> from nltk.tag import stanford 
>>> st = StanfordTagger('bidirection-distsim-wsj-0-18.tagger')

Я использовал py_compile для компиляции файла stanford.py.Я что-то упустил

Ответы [ 2 ]

3 голосов
/ 08 сентября 2011

Вы импортируете только stanford. Для доступа к StanfordTagger вам необходимо использовать либо:

>>> from nltk.tag.stanford import StanfordTagger

(при условии, что `StanfordTagger больше не вложен в модуль) или получить к нему доступ

>>> st = stanford.StanfordTagger('bidirection-distsim-wsj-0-18.tagger')
0 голосов
/ 08 марта 2014

Если вы хотите использовать синтаксический анализатор Стэнфорда, используйте это:

import os
from nltk.parse import stanford
os.environ['STANFORD_PARSER'] = '/folder/with/standford/jars'
os.environ['STANFORD_MODELS'] = '/folder/with/standford/jars'

parser = stanford.StanfordParser(model_path="/location/of/the/englishPCFG.ser.gz")
print parser.raw_batch_parse(("Hello, My name is Melroy.", "What is your name?"))

Выход:

[Tree ('ROOT', [Tree ('S', [Tree ('INTJ', [Tree ('UH', ['Hello'])]), Tree (',', [',']), Tree ('NP', [Tree ('PRP $', ['My'])), Tree ('NN', ['name'])]), Tree ('VP', [Tree ('VBZ', ['is']), Tree ('ADJP', [Tree ('JJ', ['Melroy'])])]), Tree ('.', ['.'])])]), Tree ('ROOT', [Tree ('SBARQ', [Дерево («WHNP», [Дерево («WP», [«Что»])]), Дерево («SQ», [Дерево («VBZ», ['is']), Tree ('NP', [Tree ('PRP $', ['your']), Tree ('NN', ['name'])])]), Дерево ('.', ['?'])])])]

Примечание 1: В этом примере файлы jar парсера и модели находятся в одной папке.

Примечание 2:

  • Имя файла анализатора Стэнфорда: stanford-parser.jar
  • Имя файла моделей Стэнфорда: stanford-parser-x.x.x-models.jar

Примечание 3: Файл englishPCFG.ser.gz находится внутри файла models.jar (/edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz). Пожалуйста, используйте менеджер архивов для распаковки файла models.jar.

...