Почему я не могу загрузить набор данных с помощью API загрузки Gensim - PullRequest
0 голосов
/ 12 июля 2020

Когда я делаю следующее:

>>> import gensim.downloader as api
>>> model = api.load("glove-twitter-25")  # load glove vectors

API gensim.downloader выдает следующую ошибку:

[Errno 2] Нет такого файла или каталога: '/ Users /vtim/gensim-data/information.json'.

Что я делаю не так?

1 Ответ

0 голосов
/ 11 августа 2020

У меня была такая же проблема, и я решил ее с помощью этих шагов. Я использую ma c, pycharm и virtualenv. У меня не очень много python опыта, но я сделал это вот так:

1.1. Вам нужно создать папку с именем 'gensim-data' с каталогом '/ Users / vtim / gensim-data' . Это можно сделать, запустив команду 'mkdir gensim-data' в вашем терминале (там же, где вы можете использовать команды установки pip).

1.2 Затем вам нужно добавить папку в ваш проект как контент root (чтобы код мог получить к нему доступ). Из Pycharm go из главного меню приложения (рядом с Apple lo go с ma c) Pycharm -> Preferences и там Project -> Project Structure и оттуда в правом меню выберите «Добавить контент *. 1042 * '. Найдите папку gensim-data, которую вы только что создали, и добавьте ее.

1.3 Теперь вы должны увидеть папку 'gensim-data' в папке вашего проекта, где, например, также находится venv (virtualenv). если вы его используете. Теперь создайте файл в папке 'gensim-data' с именем 'information. json'. Затем скопируйте код, найденный по этой ссылке, в файл 'information. json': https://github.com/RaRe-Technologies/gensim-data/blob/master/list.json

(проблема в том, что gensim.downloader api может у него нет доступа для записи документов в указанный каталог c, или он не может их прочитать. В моем случае он не мог этого сделать.)

Если ваш код все еще не работает, вы должны сделать следующее step:

2.1 В моем случае у меня также была проблема, заключающаяся в том, что api не мог получить доступ к файлам и нужным файлам из inte rnet. Эта проблема решается здесь: { ссылка }. Итак, найдите папку / приложение с именем Python 3.8 (если вы используете версию 3.8) на своем компьютере, откройте его и дважды щелкните «Install Certificates.command». Или вы можете попробовать запустить с терминала » open / Applications / Python \ 3.8 / Install \ Certificates.command '

Теперь код должен работать. Если этого не произошло, попробуйте запустить эти коды. Я не уверен, имеет ли это значение, но я запускаю их так, как нашел решение:

sudo python3 -m pip install --upgrade gensim

sudo -H pip install virtualenv

sudo chown -R $ USERNAME / Users / $ USERNAME / Library / Caches / pip

...