Как сделать случайную выборку из объекта ff - PullRequest
0 голосов
/ 12 июня 2019

Я хочу извлечь число 1000 значений из большого размера объекта ff в R.

Я пробовал sample_frac из dplyr пакета, но это приводит к ошибке, как показано ниже;

Ошибка: tbl должен быть фреймом данных, а не ffdf объектом

Как я могу решить эту проблему?

1 Ответ

0 голосов
/ 12 июня 2019

Вы можете использовать пакет ffbase2.Он добавляет dplyr интерфейс к ff объекту

install.packages("devtools")
devtools::install_github("edwindj/ffbase2")

и считывает ff объект как tbl с функцией tbl_ffdf.

iris_f <- tbl_ffdf(iris)

species <- 
   iris_f %>%
   group_by(Species) %>%
   summarise(petal_width = sum(Petal.Width))
...