Кто-нибудь знает, как настроить класс оболочки hunpos на nltk? - PullRequest
4 голосов
/ 23 февраля 2011

Я попробовал следующий код и установил из http://code.google.com/p/hunpos/downloads/list

english-wsj-1.0

hunpos-1.0-linux.tgz

Я извлек файл в каталог '~ /'

, и когда я попробовал следующий код Python:

import nltk
from nltk.tag import hunpos
from nltk.tag.hunpos import HunposTagger
import os, sys, re, glob
cwd = os.getcwd()

for infile in glob.glob(os.path.join(cwd, '*.txt')):
    (PATH, FILENAME) = os.path.split(infile)
    read = open(infile)
    ht = HunposTagger('english.model')
    ht.tag(read.readline())

я получаю следующую ошибку

Traceback (most recent call last):
  File "<stdin>", line 4, in <module>
  File "/usr/local/lib/python2.6/dist-packages/nltk-2.0b9-py2.6.egg/nltk/tag/hunpos.py", line 46, in __init__
    verbose=verbose)
  File "/usr/local/lib/python2.6/dist-packages/nltk-2.0b9-py2.6.egg/nltk/internals.py", line 503, in find_binary
    raise LookupError('\n\n%s\n%s\n%s' % (div, msg, div))
LookupError: 

===========================================================================
  NLTK was unable to find the hunpos-tag executable!  Use
  config_hunpos-tag() or set the HUNPOS environment variable.

    >>> config_hunpos-tag('/path/to/hunpos-tag')

  Searched in:
    - .
    - /usr/bin
    - /usr/local/bin
    - /opt/local/bin
    - /Applications/bin
    - /home/ubi/bin
    - /home/ubi/Applications/bin

  For more information, on hunpos-tag, see:
    <http://code.google.com/p/hunpos/>
===========================================================================
>>> config_hunpos-tag('~/')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
NameError: name 'config_hunpos' is not defined

как мне настроить hunpos в python?какую команду Python мне нужно ввести?

1 Ответ

4 голосов
/ 24 февраля 2011

Вы очень близки к решению. Переместите исполняемый файл hunpos-tag в / home / ubi / bin, и он сможет найти его. Это также доставило мне некоторые неприятности, когда я впервые попробовал использовать hunpos.

...