Я только что читал статью https://spark.rstudio.com/ Но я не уверен, в чем разница между работой над R, работающей напрямую под install.packages("sparklyr") пакетами
install.packages("sparklyr")
Не могли бы вы дать мне знать, я запутался
Пакет sparklyr дает вам очень похожую на env среду, которую tidy и dplyr предоставляет вам в R. Но вы напрямую работаете с spark, тогда вам придется использовать контекст spark для запуска ваших команд. Ниже приведена документация:
sparklyr
tidy
dplyr
https://spark.apache.org/docs/latest/sparkr.html