Я скачал набор данных Reuters из nltk, используя следующую команду:
import nltk
nltk.download('reuters')
Я получил подтверждение, что набор данных был загружен, и я вижу его в "C: / Users / username / AppData / Roaming / nltk_data".
Однако, когда я хочу прочитать набор данных, python не может его увидеть! Я получаю следующую ошибку:
C:\Users\username\python\Python37-32\Lib\site-packages\sklearn\externals\joblib\externals\cloudpickle\cloudpickle.py:47: DeprecationWarning: the imp module is deprecated in favour of importlib; see the module's documentation for alternative uses
import imp
Traceback (most recent call last):
File "C:\Users\username\python\Python37-32\Lib\site-packages\nltk\corpus\util.py", line 80, in __load
try: root = nltk.data.find('{}/{}'.format(self.subdir, zip_name))
File "C:\Users\username\python\Python37-32\Lib\site-packages\nltk\data.py", line 675, in find
raise LookupError(resource_not_found)
LookupError:
**********************************************************************
Resource [93mreuters[0m not found.
Please use the NLTK Downloader to obtain the resource:
[31m>>> import nltk
>>> nltk.download('reuters')
[0m
Searched in:
- 'C:\\Users\\username/nltk_data'
- 'C:\\nltk_data'
- 'D:\\nltk_data'
- 'E:\\nltk_data'
- 'C:\\Users\\username\\python\\Python37-32\\nltk_data'
- 'C:\\Users\\username\\python\\Python37-32\\share\\nltk_data'
- 'C:\\Users\\username\\python\\Python37-32\\lib\\nltk_data'
- 'C:\\Users\\username\\AppData\\Roaming\\nltk_data'
*******
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "C:\Users\username\eclipse-workspace\ML\src\PAs\pa2\Test.py", line 17, in <module>
from commons import util, datasets, runClassifier, mlGraphics
File "C:\Users\username\eclipse-workspace\ML\src\commons\datasets.py", line 258, in <module>
class Reuters:
File "C:\Users\username\eclipse-workspace\ML\src\commons\datasets.py", line 259, in Reuters
documents = reuters.fileids()
File "C:\Users\username\python\Python37-32\Lib\site-packages\nltk\corpus\util.py", line 116, in __getattr__
self.__load()
File "C:\Users\username\python\Python37-32\Lib\site-packages\nltk\corpus\util.py", line 81, in __load
except LookupError: raise e
File "C:\Users\username\python\Python37-32\Lib\site-packages\nltk\corpus\util.py", line 78, in __load
root = nltk.data.find('{}/{}'.format(self.subdir, self.__name))
File "C:\Users\username\python\Python37-32\Lib\site-packages\nltk\data.py", line 675, in find
raise LookupError(resource_not_found)
LookupError:
*********
Resource [93mreuters[0m not found.
Please use the NLTK Downloader to obtain the resource:
[31m>>> import nltk
>>> nltk.download('reuters')
[0m
Searched in:
- 'C:\\Users\\username/nltk_data'
- 'C:\\nltk_data'
- 'D:\\nltk_data'
- 'E:\\nltk_data'
- 'C:\\Users\\username\\python\\Python37-32\\nltk_data'
- 'C:\\Users\\username\\python\\Python37-32\\share\\nltk_data'
- 'C:\\Users\\username\\python\\Python37-32\\lib\\nltk_data'
-C:\\Users\\username\\AppData\\Roaming\\nltk_data'
Я пытался вручную создать каталог "C: / Users / username / nltk_data" и вставить туда файл reuters.zip, но это не помогло!
Когда я загружаю его снова с помощью nltk.download (), он показывает мне следующее:
[nltk_data] Downloading package reuters to C:\Users\username/nltk_data...
[nltk_data] Package reuters is already up-to-date!
Есть намеки?
Мне также интересно, почему пути, напечатанные Python, содержат косую черту /
и обратную косую черту \
одновременно?