Нет такого файла или каталога 'nltk_data / corpora / stopwords / English' при использовании colab - PullRequest
0 голосов
/ 14 декабря 2018

Прежде всего, я использую Google colab для работы, и я скачал nltk stopwords для английского языка со следующим:

nltk.download('stopwords')

Загрузка прошла успешно

[nltk_data] Downloading package stopwords to /root/nltk_data...

, но когда япробег stop = stopwords.words('English')

Я получаю OSError: No such file or directory: '/root/nltk_data/corpora/stopwords/English'

1 Ответ

0 голосов
/ 14 декабря 2018

TL; DR

English должен быть в нижнем регистре =)

См .: https://colab.research.google.com/drive/1tNt0Ifom-h4OnFBBZpLndYCEPDU598jE

В коде

# Downloads the data.
import nltk
nltk.download('stopwords')


# Using the stopwords.
from nltk.corpus import stopwords

# Initialize the stopwords
stoplist = stopwords.words('english')
...