параллелизируйте операцию group_walk с помощью multidplyr - PullRequest
1 голос
/ 18 июня 2020

Можно ли распараллелить операцию dplyr::group_walk над сгруппированными данными с помощью multidplyr?

В этой первой попытке ответить на общий вопрос я не буду предоставлять репрезентацию, но если это поможет, я могу.

У меня есть несколько временных рядов для многих людей, и я хотел бы эффективно построить графики для каждой переменной для каждого человека.

Мой код выглядит примерно так:

time_series_data %>%
  group_by(id) %>%
  group_walk(~plot_function(.x))

My plot_function() экспортирует график для каждого человека. Он работает нормально, но долго, и мне приходится повторять его для нескольких измерений (тепло, влажность и т. Д. c). Поэтому мне было интересно, есть ли способ ускорить процесс, используя multidplyr, с помощью чего-то, что выглядело бы так:

cluster <- new_cluster(6)
time_series_data %>%
  group_by(id) %>%
  partition(cluster) %>%
  group_walk(~plot_function(.x))

Есть ли способ сделать что-то подобное, чтобы ускорить мой процесс?

Заранее благодарим за любую помощь :)

...