НЛТК в пидевском затмении - PullRequest
0 голосов
/ 01 февраля 2011

У меня есть Python 2.6, NLTK для Python и несколько внешних ресурсов, которые я использую. Проблема в том, что все распознается (операторы импорта)

from nltk import sent_tokenize
from nltk import word_tokenize 
import re 
from nltk.corpus import stopwords 
from nltk.stem import PorterStemmer 
from nltk.probability import FreqDist

Traceback (most recent call last):
  File "E:\Program Files\eclipse\Martin Project Folder\labs2\src\lab2.py", line 22, in <module>
    sents.append(sent_tokenize( review.raw( ) ))

on line 22 you :

Resource 'tokenizers/punkt/english.pickle' not found.  Please
  use the NLTK Downloader to obtain the resource: >>>
  nltk.download().
  Searched in:
    - 'C:\\Users\\Martinos/nltk_data'
    - 'C:\\nltk_data'
    - 'D:\\nltk_data'
    - 'E:\\nltk_data'
    - 'E:\\Python26\\nltk_data'
    - 'E:\\Python26\\lib\\nltk_data'
    - 'C:\\Users\\Martinos\\AppData\\Roaming\\nltk_data'

Кто-нибудь знает, почему это так, поскольку программа должна найти версию punkd В nltk (поскольку она распознает nltk)?

Ответы [ 2 ]

1 голос
/ 13 февраля 2014

Вам необходимо скачать ресурсы nltk.Для решения проблемы сделайте следующее:

Python mode in the Terminal and run following commands 
import nltk 
nltk.download()
1 голос
/ 04 февраля 2011

Как говорится в сообщении об ошибке в stacktrace, вы должны вызвать функцию 'nltk.download ()' из консоли python для загрузки необходимых вам ресурсов. Также в этом сообщении перечислены все пути, по которым nltk пытался найти отсутствующий ресурс.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...