РЕДАКТИРОВАТЬ: я последовал совету Алистера ниже, и установил докер и Numpy с пипс.
Однако это приводит к новой ошибке при запуске install_splash () в R:
> install_splash()
Error in py_call_impl(callable, dots$args, dots$keywords) :
AttributeError: module 'os' has no attribute 'errno'
3. stop(structure(list(message = "AttributeError: module 'os' has no
attribute 'errno'",
call = py_call_impl(callable, dots$args, dots$keywords),
cppstack = structure(list(file = "", line = -1L, stack = "C++ stack not available on this system"), class =
"Rcpp_stack_trace")), class = c("Rcpp::exception",
"C++Error", "error", "condition")))
2.client$api$pull("scrapinghub/splash", tag)
1.install_splash()
Когда я перезапускаю install_splash () с отладкой, я получаю следующее сообщение:
Detailed traceback:
File "C:\Python37\lib\site-packages\docker\api\image.py", line 380, in pull
header = auth.get_config_header(self, registry)
File "C:\Python37\lib\site-packages\docker\auth.py", line 48, in get_config_header
client._auth_configs, registry, credstore_env=client.credstore_env
File "C:\Python37\lib\site-packages\docker\auth.py", line 96, in resolve_authconfig
authconfig, registry, store_name, env=credstore_env
File "C:\Python37\lib\site-packages\docker\auth.py", line 129, in _resolve_authconfig_credstore
data = store.get(registry)
File "C:\Python37\lib\site-packages\dockerpycreds\store.py", line 35, in get
data = self._execute('get', server)
File "C:\Python37\lib\site-packages\dockerpycreds\store.py", line 89, in _execute
if e.errno == os.errno.ENOENT:
Что дает? Я знаю, что Splash запущен и работает, и я подтвердил правильность установки модулей докера и numpy с помощью pip freeze
.
Оригинальный пост:
Я пытаюсь очистить таблицы от нескольких веб-сайтов в R. Для этого мне было рекомендовано использовать Splash через Docker. Я скачал Docker, и мне удалось его запустить. Кроме того, я установил Python 3.5. Я вытащил изображение Splash с помощью команды:
docker pull scrapinghub/splash
и запустил контейнер командой:
docker run -p 8050:8050 -p 5023:5023 scrapinghub/splash
Я проверил, действительно ли работает Splash, проверив 'http://localhost:8050/' в моем браузере - он работает.
В R я выполнил следующую команду:
> splash_active()
Что возвращает это:
Status of splash instance on [http://localhost:8050]: ok. Max RSS: 73 Mb
[1] TRUE
Пока все хорошо. Сейчас я пытаюсь установить Splash в R командой:
install_splash()
Но R возвращает ошибку, говоря:
Error: Python module docker was not found.
Detected Python configuration:
python: C:\Users\Lucas\AppData\Local\Programs\Python\Python37\\python.exe
libpython: C:/Users/Lucas/AppData/Local/Programs/Python/Python37/python37.dll
pythonhome: C:\Users\Lucas\AppData\Local\Programs\Python\Python37
version: 3.7.0 (v3.7.0:1bf9cc5093, Jun 27 2018, 04:59:51) [MSC v.1914 64 bit (AMD64)]
Architecture: 64bit
numpy: [NOT FOUND]
docker: [NOT FOUND]
В чем может быть проблема? Это связано с тем, что 'numpy' и 'docker' не найдены?