Почему долгоформатные структуры данных занимают больше памяти в R? - PullRequest
0 голосов
/ 26 апреля 2018

При работе с большими наборами данных, я замечаю, что плавление / сбор данных занимает гораздо больше памяти на моей машине, чем когда набор данных большой.

Пример:

library(tidyr)
library(tibble)
test <- mtcars %>%
     rownames_to_column() %>%
     gather()

object.size(mtcars)

#6736 bytes

object.size(test)

#16960 bytes

Оба объекта хранят одни и те же данные, но первый - широкий, а второй - длинный.Длинная версия почти втрое больше.

Почему это?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...