Размер объекта ExpressionSet в R - PullRequest
0 голосов
/ 13 марта 2020

Мне интересно, как объекты ExpressionSet могут быть такими легкими?

library(Biobase)
data(sample.ExpressionSet)
ls()

sample.ExpressionSet

ES = sample.ExpressionSet
mat = exprs(sample.ExpressionSet) 
pdata = pData(sample.ExpressionSet) 
fdata = fData(sample.ExpressionSet) 
sapply(list(ES = ES, mat = mat, pdata = pdata, fdata = fdata), object.size)

ES mat pdata fdata

59256 142616 4128 37064

file.size(paste0(.libPaths(),'/Biobase/data/sample.ExpressionSet.rda'))

72860 NA

Матрица в два раза больше файла и почти в 3 раза больше размера объекта ES. В тесте с большим набором данных я даже обнаружил, что разница между матом и ES может достигать 60 раз!

Из прочтения документации Biobase я понимаю, что это связано с использованием среды вместо списка в качестве режима хранения (необходимо указать «lockedEnvironment» c). Однако я не совсем понимаю, почему существует такая большая разница в размерах. И о том, как установить режим хранения среды для любого произвольного объекта R. У кого-нибудь есть подсказки, или можете отослать меня к хорошей документации на эту тему?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...