При работе с большими наборами данных, я замечаю, что плавление / сбор данных занимает гораздо больше памяти на моей машине, чем когда набор данных большой.
Пример:
library(tidyr)
library(tibble)
test <- mtcars %>%
rownames_to_column() %>%
gather()
object.size(mtcars)
#6736 bytes
object.size(test)
#16960 bytes
Оба объекта хранят одни и те же данные, но первый - широкий, а второй - длинный.Длинная версия почти втрое больше.
Почему это?