Мне нужно прочитать файл типа «.csv», используя библиотеку «sparklyr», в которой числовые значения отображаются с запятыми.Идея состоит в том, чтобы иметь возможность читать, используя «spark_read_csv ()» напрямую.
Я использую:
library(sparklyr)
library(dplyr)
f<-data.frame(DNI=c("22-e","EE-4","55-W"),
DD=c("33,2","33.2","14,55"),CC=c("2","44,4","44,9"))
write.csv(f,"aff.csv")
sc <- spark_connect(master = "local", spark_home = "/home/tomas/spark-2.1.0-bin-hadoop2.7/", version = "2.1.0")
df <- spark_read_csv(sc, name = "data", path = "/home/tomas/Documentos/Clusterapp/aff.csv", header = TRUE, delimiter = ",")
tbl <- sdf_copy_to(sc = sc, x =df , overwrite = T)
Проблема, считайте числа как фактор