Я написал следующую функцию, которая закрывает до того, что я хочу:
readBigBz2 <- function(fn, sample_size=1000) {
f <- bzfile(fn, "r")
rv <- c()
repeat {
lines <- readLines(f, sample_size)
if (length(lines) == 0) break
rv <- append(rv, sample(lines, 1))
}
close(f)
rv
}
Возможно, я хочу использовать sqldf в долгосрочной перспективе, но это довольно эффективноспособ выборки самого файла.Я просто не знаю, как обернуть это вокруг соединения для read.csv или аналогичного.