Итерация (не одновременно) по нескольким спискам с использованием purrr? - PullRequest
0 голосов
/ 07 февраля 2019

Я хочу создать несколько фреймов данных, которые фильтруются с использованием трех переменных в моем наборе данных: state является категориальной переменной с двумя возможными значениями - va и az;log_aa_3r и log_lat_3r - это непрерывные числовые переменные.

Я хочу получить 4 кадра данных: 2 для каждого состояния, и значения dfs для каждого состояния будут отфильтрованы, так что во всех случаяхlog_aa_3r конечно, а во всех остальных случаях log_lat_3r конечно.

Я могу сделать это вручную следующим образом:

library(tidyverse)
az_aa <- combine_dat %>%
  filter(state == "az" & is.finite(log_aa_3r))

az_lat <- combine_dat %>%
  filter(state == "az" & is.finite(log_lat_3r))

va_aa <- combine_dat %>%
  filter(state == "va" & is.finite(log_aa_3r))

va_lat <- combine_dat %>%
  filter(state == "va" & is.finite(log_lat_3r))

Однако я бы хотелвыяснить, как сделать это итеративно.

Мне кажется, что мне нужно использовать вложенные операторы map для решения этой проблемы, но я не совсем понимаю, как правильно написать код.Я попробовал следующее, и он выдает ожидаемую структуру выходных данных, но все dfs в выходных данных имеют 0 наблюдений:

states <- list('az', 'va')
use_vars <- list('log_aa_3r', 'log_lat_3r')

dfs <- map(states, function(x)
           {map(use_vars,
                function(y) {comb_test %>%
                 filter(state == x & is.finite(y))}
                )}
           )

Вот небольшой набор данных, чтобы помочь с проблемой:

comb_test <- structure(list(state = c("az", "az", "va", "az", "az", "va", 
"va", "az", "va", "va", "az", "az", "az", "va", "az", "az", "va", 
"az", "az", "va"), log_aa_3r = c(0.122043015617762, NaN, 0.418616817019589, 
NaN, -0.237849698703905, 0.11553768471152, NA, -Inf, 0.253046912790677, 
0.71751672463271, -Inf, -Inf, -Inf, 0.125839047001367, -Inf, 
0.372823951010564, 0.43784426926065, -Inf, -Inf, NA), log_lat_3r = c(0.0393482723090127, 
-0.352428653057281, -0.0641399653902218, -0.306485199414877, 
-0.696871579650928, -0.191460177039553, NA, -0.361114213161674, 
-0.0786756534620034, 0.216382765848136, 0.0344915670084646, 0.00130866713103227, 
0.756875541289108, NA, -0.216873938300614, -0.0627820764799239, 
0.261387831919094, -0.018314845703395, -0.161990655409072, NA
)), row.names = c(NA, -20L), class = c("tbl_df", "tbl", "data.frame"
))

Любая помощь будет принята с благодарностью!

РЕДАКТИРОВАТЬ:

Я получил ее на работу, используя следующий код.Возможно, он не самый элегантный, потому что в итоге у меня было tbl имен, которые были идентичны именам переменных, но он делал то, что пытался сделать.

df2 <- 
  map(states, function(x) 
{map_at(combine_test, c("log_aa_3r", "log_lat_3r"), function(y) 
{combine_test %>%
    filter(state == x & is.finite(y))})}
  )

df_list <- list(az_aa = df2[[1]]$log_aa_3r, az_lat = df2[[1]]$log_lat_3r, 
                va_aa = df2[[2]]$log_aa_3r, va_lat = df2[[2]]$log_lat_3r)

1 Ответ

0 голосов
/ 07 февраля 2019

Вот один из способов сделать это.Сначала вы можете сгенерировать все ваши условия с помощью tidyr::crossing

states <- c('az', 'va')
use_vars <- c('log_aa_3r', 'log_lat_3r')
conditions <- tidyr::crossing(states, use_vars)

Затем вы можете использовать purrr::pmap для итерации по этим двум спискам

purrr::pmap(conditions, function(states, use_vars) {
  comb_test %>% filter(state==!!(states) & is.finite(!!sym(use_vars)))
})

Здесь мы используем сплайсинг (!!) для вставки значений и использования sym() для преобразования строковой версии имени переменной в символ

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...