dplyr :: mutate_at перебирает столбцы в функции - PullRequest
4 голосов
/ 25 марта 2020
require(dplyr)
df <- data.frame(Date.time = c("2015-01-01 00:00:00", "2015-01-01 00:30:00", "2015-01-01 01:00:00", "2015-01-01 01:30:00", "2015-01-01 02:00:00"),
           RH33HMP = c(99.6,99.6,99.5,99.3,98.63),
           RH33HMP_f = c(9,9,92,93,9),
           RH38HMP = c(99.6,99.6,99.5,99.3,98.63),
           RH38HMP_f = c(9,902,9,9,91))

Вот пример data.frame. Я хотел бы установить каждое значение на NA, где соответствующий столбец качества (_f) содержит что-то другое, чем 9. Сначала я сопоставляю номер столбца с фактическими измерениями:

col_var <- grep("^Date.|_f$", names(df), invert = T)

Затем я использую dplyr и mutate_at с функцией if_else. Моя проблема в том, что mutate_at перебирает все столбцы col_val, но сама функция этого не делает. Я попробовал несколько примеров, которые я нашел в stackoverflow, но ни один из них, похоже, не работает.

# does not work
df_qc <- df %>%
  mutate_at(.vars = col_var,
            .funs = list(~ ifelse(df[, col_var+1] == 9, ., NA)))

i=1
df_qc <- df %>%
  mutate_at(.vars = col_var,
            .funs = list(~ ifelse(df[, i+1] == 9, ., NA)))

Я думаю, что я довольно близок, любая помощь приветствуется.

Ответы [ 2 ]

1 голос
/ 25 марта 2020

Один dplyr и purrr параметр может быть:

map2_dfr(.x = df %>%
          select(ends_with("HMP")),
         .y = df %>%
          select(ends_with("_f")),
         ~ replace(.x, .y != 9, NA)) %>%
 bind_cols(df %>%
            select(-ends_with("HMP")))

  RH33HMP RH38HMP Date.time           RH33HMP_f RH38HMP_f
    <dbl>   <dbl> <fct>                   <dbl>     <dbl>
1    99.6    99.6 2015-01-01 00:00:00         9         9
2    99.6    NA   2015-01-01 00:30:00         9       902
3    NA      99.5 2015-01-01 01:00:00        92         9
4    NA      99.3 2015-01-01 01:30:00        93         9
5    98.6    NA   2015-01-01 02:00:00         9        91
1 голос
/ 25 марта 2020

Мы можем использовать Map:

df[col_var] <- Map(function(x, y) {y[x != 9] <- NA;y},df[col_var + 1],df[col_var])
df

#            Date.time RH33HMP RH33HMP_f RH38HMP RH38HMP_f
#1 2015-01-01 00:00:00   99.60         9    99.6         9
#2 2015-01-01 00:30:00   99.60         9      NA       902
#3 2015-01-01 01:00:00      NA        92    99.5         9
#4 2015-01-01 01:30:00      NA        93    99.3         9
#5 2015-01-01 02:00:00   98.63         9      NA        91

Аналогично, вы можете использовать map2 в purrr, если вы предпочитаете tidyverse.

df[col_var] <- purrr::map2(df[col_var + 1],df[col_var], ~{.y[.x != 9] <- NA;.y})
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...