R data.table. интерфейс для файлов fst на диске: fst_table - PullRequest
0 голосов
/ 22 марта 2020

Я хочу использовать для большого набора данных функцию fst_table из пакета "fstpackage", найденного здесь: https://github.com/fstpackage/fsttable.

devtools::install_github("fstpackage/fsttable")
library(fsttable)
nr_of_rows <- 1e6
x <- data.table::data.table(X = 1:nr_of_rows, Y = LETTERS[1 + (1:nr_of_rows) %% 26])
fst::write_fst(x, "1.fst")
ft <- fst_table("1.fst")

Я могу извлечь строки и столбцы из созданный файл, однако, возможно ли выполнять такие операции, как:

ft[X == 1,]

как в стандартном файле data.table? или я могу создать ключ этого data.table для быстрой сериализации? Моя цель состоит в том, чтобы извлечь данные, используя значения столбцов, не загружая весь набор данных в память.

...