Можно ли распараллелить операцию dplyr::group_walk
над сгруппированными данными с помощью multidplyr
?
В этой первой попытке ответить на общий вопрос я не буду предоставлять репрезентацию, но если это поможет, я могу.
У меня есть несколько временных рядов для многих людей, и я хотел бы эффективно построить графики для каждой переменной для каждого человека.
Мой код выглядит примерно так:
time_series_data %>%
group_by(id) %>%
group_walk(~plot_function(.x))
My plot_function()
экспортирует график для каждого человека. Он работает нормально, но долго, и мне приходится повторять его для нескольких измерений (тепло, влажность и т. Д. c). Поэтому мне было интересно, есть ли способ ускорить процесс, используя multidplyr
, с помощью чего-то, что выглядело бы так:
cluster <- new_cluster(6)
time_series_data %>%
group_by(id) %>%
partition(cluster) %>%
group_walk(~plot_function(.x))
Есть ли способ сделать что-то подобное, чтобы ускорить мой процесс?
Заранее благодарим за любую помощь :)