У меня кластер с запущенным Cloudera CDH.Мне нужно подключить мои R-программы (работающие на моем ноутбуке) к Spark, работающему в кластере.
Однако, если я пытаюсь подключить локальный R через Sparklyr, он выдает ошибку.Поскольку поиск по дому Spark на ноутбуке сам по себе означает, что я должен установить spark на свой ноутбук, но я не могу этого сделать.
Я погуглил и обнаружил, что мы можем установить SparkR и использовать R с Spark.Тем не менее, для использования sparkR, что мне нужно сделать:
- установить SparkR на все узлы кластера?
- Как настроить использование SparkR?