Как подключиться к спарк кластеру с помощью клиента R - PullRequest
0 голосов
/ 31 мая 2018

У меня кластер с запущенным Cloudera CDH.Мне нужно подключить мои R-программы (работающие на моем ноутбуке) к Spark, работающему в кластере.

Однако, если я пытаюсь подключить локальный R через Sparklyr, он выдает ошибку.Поскольку поиск по дому Spark на ноутбуке сам по себе означает, что я должен установить spark на свой ноутбук, но я не могу этого сделать.

Я погуглил и обнаружил, что мы можем установить SparkR и использовать R с Spark.Тем не менее, для использования sparkR, что мне нужно сделать:

  1. установить SparkR на все узлы кластера?
  2. Как настроить использование SparkR?
...