Пытаюсь установить splash в R, без удачи - PullRequest
0 голосов
/ 15 сентября 2018

РЕДАКТИРОВАТЬ: я последовал совету Алистера ниже, и установил докер и Numpy с пипс.

Однако это приводит к новой ошибке при запуске install_splash () в R:

     > install_splash()
       Error in py_call_impl(callable, dots$args, dots$keywords) : 
         AttributeError: module 'os' has no attribute 'errno' 

       3. stop(structure(list(message = "AttributeError: module 'os' has no 
          attribute 'errno'", 
              call = py_call_impl(callable, dots$args, dots$keywords), 
              cppstack = structure(list(file = "", line = -1L, stack = "C++ stack not available on this system"), class = 
            "Rcpp_stack_trace")), class = c("Rcpp::exception", 
          "C++Error", "error", "condition"))) 
       2.client$api$pull("scrapinghub/splash", tag) 
       1.install_splash() 

Когда я перезапускаю install_splash () с отладкой, я получаю следующее сообщение:

Detailed traceback: 
  File "C:\Python37\lib\site-packages\docker\api\image.py", line 380, in pull
    header = auth.get_config_header(self, registry)
  File "C:\Python37\lib\site-packages\docker\auth.py", line 48, in get_config_header
    client._auth_configs, registry, credstore_env=client.credstore_env
  File "C:\Python37\lib\site-packages\docker\auth.py", line 96, in resolve_authconfig
    authconfig, registry, store_name, env=credstore_env
  File "C:\Python37\lib\site-packages\docker\auth.py", line 129, in _resolve_authconfig_credstore
    data = store.get(registry)
  File "C:\Python37\lib\site-packages\dockerpycreds\store.py", line 35, in get
    data = self._execute('get', server)
  File "C:\Python37\lib\site-packages\dockerpycreds\store.py", line 89, in _execute
    if e.errno == os.errno.ENOENT:

Что дает? Я знаю, что Splash запущен и работает, и я подтвердил правильность установки модулей докера и numpy с помощью pip freeze.


Оригинальный пост:

Я пытаюсь очистить таблицы от нескольких веб-сайтов в R. Для этого мне было рекомендовано использовать Splash через Docker. Я скачал Docker, и мне удалось его запустить. Кроме того, я установил Python 3.5. Я вытащил изображение Splash с помощью команды:

docker pull scrapinghub/splash

и запустил контейнер командой:

docker run -p 8050:8050 -p 5023:5023 scrapinghub/splash

Я проверил, действительно ли работает Splash, проверив 'http://localhost:8050/' в моем браузере - он работает.

В R я выполнил следующую команду:

> splash_active()

Что возвращает это:

Status of splash instance on [http://localhost:8050]: ok. Max RSS: 73 Mb

[1] TRUE

Пока все хорошо. Сейчас я пытаюсь установить Splash в R командой:

install_splash()

Но R возвращает ошибку, говоря:

Error: Python module docker was not found.

Detected Python configuration:

python:         C:\Users\Lucas\AppData\Local\Programs\Python\Python37\\python.exe
libpython:      C:/Users/Lucas/AppData/Local/Programs/Python/Python37/python37.dll
pythonhome:     C:\Users\Lucas\AppData\Local\Programs\Python\Python37
version:        3.7.0 (v3.7.0:1bf9cc5093, Jun 27 2018, 04:59:51) [MSC v.1914 64 bit (AMD64)]
Architecture:   64bit
numpy:           [NOT FOUND]
docker:         [NOT FOUND]

В чем может быть проблема? Это связано с тем, что 'numpy' и 'docker' не найдены?

...