Я пытаюсь оптимизировать длительные операции времени выполнения в своем коде R и догадываюсь, почему это занимает слишком много времени.
Я работаю с большими данными, и мой код выглядит примерно так:
var <- data.table(data) %>%
select(some_features) %>%
setnames(new_names) %>%
merge(blablabla) %>%
filter(screenName %in% DEFAULT_USERS) %>%
# Some long runtime operations because large data
...... %>%
merge(some_df) %>% data.table() %>%
select(some_boring_features)
Я предполагаю, что R хранит все переменные в ОЗУ (так же, как и все языки) ... Но когда используется%>%, результаты этих запущенных операций еще не сохраняются в переменной, и я предлагаю сохранить их в кэш-памяти. вместо использования оперативной памяти. Правильно ли это?
Было бы лучше создать новые переменные и сохранить частичные результаты в ОЗУ, а не выполнять весь поток?
Спасибо!