Я использую RStudio Server, работающий в кластере Databricks. Один из способов использования синтаксиса SQL для управления кадрами данных в кластере - использование пакета DBI. Например,
library(DBI)
df <- dbGetQuery(sc, "select * from table_on_cluster")
Однако это сохраняет результат как объект R (df). Я хотел бы продолжать работать против кластера (через sparklyr). Вместо того, чтобы выполнить дополнительный шаг, чтобы записать это обратно в кластер, как показано ниже, есть ли способ, которым я мог бы сделать это за один шаг?
tbl_df <- copy_to(sc, df)
Т.е. я хотел бы, чтобы результат синтаксиса SQL был записан в кластере. Вышеописанное болезненно, потому что copy_to очень медленный, особенно для больших данных.