Я хочу создать несколько фреймов данных, которые фильтруются с использованием трех переменных в моем наборе данных: state
является категориальной переменной с двумя возможными значениями - va
и az
;log_aa_3r
и log_lat_3r
- это непрерывные числовые переменные.
Я хочу получить 4 кадра данных: 2 для каждого состояния, и значения dfs для каждого состояния будут отфильтрованы, так что во всех случаяхlog_aa_3r
конечно, а во всех остальных случаях log_lat_3r
конечно.
Я могу сделать это вручную следующим образом:
library(tidyverse)
az_aa <- combine_dat %>%
filter(state == "az" & is.finite(log_aa_3r))
az_lat <- combine_dat %>%
filter(state == "az" & is.finite(log_lat_3r))
va_aa <- combine_dat %>%
filter(state == "va" & is.finite(log_aa_3r))
va_lat <- combine_dat %>%
filter(state == "va" & is.finite(log_lat_3r))
Однако я бы хотелвыяснить, как сделать это итеративно.
Мне кажется, что мне нужно использовать вложенные операторы map для решения этой проблемы, но я не совсем понимаю, как правильно написать код.Я попробовал следующее, и он выдает ожидаемую структуру выходных данных, но все dfs в выходных данных имеют 0 наблюдений:
states <- list('az', 'va')
use_vars <- list('log_aa_3r', 'log_lat_3r')
dfs <- map(states, function(x)
{map(use_vars,
function(y) {comb_test %>%
filter(state == x & is.finite(y))}
)}
)
Вот небольшой набор данных, чтобы помочь с проблемой:
comb_test <- structure(list(state = c("az", "az", "va", "az", "az", "va",
"va", "az", "va", "va", "az", "az", "az", "va", "az", "az", "va",
"az", "az", "va"), log_aa_3r = c(0.122043015617762, NaN, 0.418616817019589,
NaN, -0.237849698703905, 0.11553768471152, NA, -Inf, 0.253046912790677,
0.71751672463271, -Inf, -Inf, -Inf, 0.125839047001367, -Inf,
0.372823951010564, 0.43784426926065, -Inf, -Inf, NA), log_lat_3r = c(0.0393482723090127,
-0.352428653057281, -0.0641399653902218, -0.306485199414877,
-0.696871579650928, -0.191460177039553, NA, -0.361114213161674,
-0.0786756534620034, 0.216382765848136, 0.0344915670084646, 0.00130866713103227,
0.756875541289108, NA, -0.216873938300614, -0.0627820764799239,
0.261387831919094, -0.018314845703395, -0.161990655409072, NA
)), row.names = c(NA, -20L), class = c("tbl_df", "tbl", "data.frame"
))
Любая помощь будет принята с благодарностью!
РЕДАКТИРОВАТЬ:
Я получил ее на работу, используя следующий код.Возможно, он не самый элегантный, потому что в итоге у меня было tbl
имен, которые были идентичны именам переменных, но он делал то, что пытался сделать.
df2 <-
map(states, function(x)
{map_at(combine_test, c("log_aa_3r", "log_lat_3r"), function(y)
{combine_test %>%
filter(state == x & is.finite(y))})}
)
df_list <- list(az_aa = df2[[1]]$log_aa_3r, az_lat = df2[[1]]$log_lat_3r,
va_aa = df2[[2]]$log_aa_3r, va_lat = df2[[2]]$log_lat_3r)