Блестящее подключение к экземпляру HDP-Sandbox Spark - PullRequest
1 голос
/ 15 июня 2019

Я хотел бы подключить экземпляр R к Spark, работающему в HDP-песочнице, развернутой в Docker на одном локальном компьютере. Сообщение об ошибке указывает, что --version вызов на spark-submit не удается.

R экземпляр

packageVersion("sparklyr")
# [1] ‘1.0.1’

# Set old JAVA version
Sys.setenv("JAVA_HOME" =
               "/Library/Java/JavaVirtualMachines/jdk1.8.0_181.jdk/Contents/Home")

library(sparklyr)

sc <- spark_connect(
    master = " http://localhost:4040",
    spark_home = "/usr/hdp/current/spark2-client",
    app_name = "RStudio",
    method = "shell"
)

Ошибка в system2(file.path(spark_home, "bin", "spark-submit"), "--version",: ошибка при выполнении команды

HDP

[root@sandbox-hdp ~]# /usr/hdp/current/spark2-client/bin/spark-submit --version
Welcome to
      ____              __
     / __/__  ___ _____/ /__
    _\ \/ _ \/ _ `/ __/  '_/
   /___/ .__/\_,_/_/ /_/\_\   version 2.3.1.3.0.1.0-187
      /_/

Using Scala version 2.11.8, OpenJDK 64-Bit Server VM, 1.8.0_191
Branch HEAD
Compiled by user jenkins on 2018-09-19T10:10:07Z
Revision fe7bed1ca174a6687ebd2aa0f8ba5fb7bf668399
Url git@github.com:hortonworks/spark2.git
Type --help for more information.

Обновление

Я прибег к использованию Livy, так как это кажется более простым решением. Я открыл порт 8999, на который есть ссылка в файле livy.conf, и теперь могу получить доступ к интерфейсу Livy по адресу http://localhost:8999/ui.

Livy Session

Несмотря на это, я все равно получаю ошибки при попытке подключения:

config <- livy_config()
sc <- spark_connect(master = "http://localhost:8999",
                     method = "livy",
                     config = config)
# Error in livy_connection(master = master, config = config, app_name, version,  : 
# Failed to launch livy session, session status is still starting after waiting for 60 seconds


config <- livy_config(username = "root", password = "***")
sc <- spark_connect(master = "http://localhost:8999",
                     method = "livy",
                     config = config)
# Error in livy_connection(master = master, config = config, app_name, version,  : 
# Failed to launch livy session, session status is still starting after waiting for 60 seconds
...