Вопрос
Интересно, есть ли способ print
или cat
при использовании multidplyr
.
Поскольку у меня было бы много строк, и я применил бы к нему map
, было бы неплохо узнать, какая строка в настоящее время обрабатывается.
Пример
library(dplyr)
library(purrr)
library(multidplyr)
my_fun <- function(x, y){
#' @description print the value and multiply by 2
#' @param x id of the row
#' @param y an integer input
cat(x)
out <- y^2
return(out)
}
tibble(id = letters[1:10],
value = c(1:10)) %>%
partition(id) %>%
cluster_library('purrr') %>%
cluster_copy(my_fun) %>%
mutate(out = map2(id, value, ~my_fun(.x, .y)))
Был аналогичный вопрос о параллельной обработке, и, возможно, будет использовано то же решение?