Расхождение в размере RDS между данными и подмножеством данных - PullRequest
0 голосов
/ 04 декабря 2018

Я замечаю интересное несоответствие, когда меньший фрейм данных имеет больший размер, когда я сохраняю их в файлы RDS.Рассмотрим два фрейма данных:

Фрейм данных A (DFA): содержит 22 переменные и 2 000 000 наблюдений

Фрейм данных B (DFB): подмножество A, удаляющее строки, где гендерная переменная равна женской,Кроме того, в DFA было 3 пустых столбца, которые были отброшены, поэтому этот фрейм данных содержит 19 переменных и 1 800 000 наблюдений

Так что DFB - это подмножество столбцов и подмножество строк DFA, но размер файла RDS для DFA(8,6 МБ) меньше, чем размер для DFB (11,4 МБ).

Почему это будет?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...