Мне нужно импортировать файл SPSS .sav в R каждый день как фрейм данных без меток значений.Файл более 120000 набирает обороты.Этот процесс становится невероятно медленным, поэтому я хочу убедиться, что я использую самый быстрый из возможных методов.Я играл с функциями в иностранном, гавани и мемиск.Я работаю с RDS, если это имеет значение.
Редактировать: Мой файл имеет размер 126343 x 33067 и 12,1 ГБ. Я просто запускаю следующий код:
library(haven)
data <- read_sav(file)
Iне могу поделиться этим файлом, но чтобы попытаться воспроизвести, я сделал:
library(haven)
n <- 126343
exd <- data.frame(c(replicate(2000, sample(letters, n, replace = TRUE),
simplify = FALSE),
replicate(1306, runif(n),
simplify = FALSE)))
dim(exd)
## [1] 126343 3306
tmp <- tempfile(fileext = ".sav")
write_sav(exd, tmp)
system.time(exd2 <- read_sav(tmp))
## user system elapsed
## 173.34 13.94 187.66
Спасибо!