Question

Набор данных содержит много столбцов, содержащих значения, которые являются либо NA, либо 1, вроде как:

> data_frame(a = c(NA, 1, NA, 1, 1), b=c(1, NA, 1, 1, NA))
# A tibble: 5 x 2
      a     b
  <dbl> <dbl>
1 NA     1.00
2  1.00 NA   
3 NA     1.00
4  1.00  1.00
5  1.00 NA

Желаемый вывод: заменить все 1 значения именем столбца в виде строки,

> data_frame(a = c(NA, 'a', NA, 'a', 'a'), b=c('b', NA, 'b', 'b', NA))
# A tibble: 5 x 2
  a     b    
  <chr> <chr>
1 <NA>  b    
2 a     <NA> 
3 <NA>  b    
4 a     b    
5 a     <NA>

вот моя попытка использования анонимной функции в transmute_all:

> data_frame(a = c(NA, 1, NA, 1, 1), b=c(1, NA, 1, 1, NA)) %>%
+     transmute_all(
+         funs(function(x){if (x == 1) deparse(substitute(x)) else NA})
+     )
Error in mutate_impl(.data, dots) : 
  Column `a` is of unsupported type function

РЕДАКТИРОВАТЬ: Попытка № 2:

> data_frame(a = c(NA, 1, NA, 1, 1), b=c(1, NA, 1, 1, NA)) %>%
+     transmute_all(
+         funs(
+             ((function(x){if (!is.na(x)) deparse(substitute(x)) else NA})(.))
+             )
+     )
# A tibble: 5 x 2
  a     b    
  <lgl> <chr>
1 NA    b    
2 NA    b    
3 NA    b    
4 NA    b    
5 NA    b    
Warning messages:
1: In if (!is.na(x)) deparse(substitute(x)) else NA :
  the condition has length > 1 and only the first element will be used
2: In if (!is.na(x)) deparse(substitute(x)) else NA :
  the condition has length > 1 and only the first element will be used
>

alistaire · Answer 1 · 02 мая 2018

Поскольку deparse(substitute(.)) вернет строку длины 1, вы можете просто установить подмножество непосредственно с помощью ., так как подмножество с помощью NA вернет NA:

library(tidyverse)

df <- data_frame(a = c(NA, 1, NA, 1, 1), 
                 b = c(1, NA, 1, 1, NA))

df %>% mutate_all(funs(deparse(substitute(.))[.]))
#> # A tibble: 5 x 2
#>   a     b    
#>   <chr> <chr>
#> 1 <NA>  b    
#> 2 a     <NA> 
#> 3 <NA>  b    
#> 4 a     b    
#> 5 a     <NA>

Подход, не предусматривающий синтаксический анализ имен, заключается в преобразовании в длинную форму, чтобы имена переменных представляли собой переменные, с которыми можно работать как обычно. Здесь приведение к логическому вектору приводит к тому, что подмножество ведет себя так же, как и выше. Добавление столбца индекса необходимо, если вы хотите сохранить порядок строк при преобразовании обратно в широкую форму.

df %>% 
    rowid_to_column('i') %>% 
    gather(variable, value, -i) %>% 
    mutate(value = variable[as.logical(value)]) %>% 
    spread(variable, value)
#> # A tibble: 5 x 3
#>       i a     b    
#>   <int> <chr> <chr>
#> 1     1 <NA>  b    
#> 2     2 a     <NA> 
#> 3     3 <NA>  b    
#> 4     4 a     b    
#> 5     5 a     <NA>

Jan · Answer 2 · 02 мая 2018

База R тоже подойдет:

nn <- names(df)
for (i in seq_along(df)) {
  df[i] <- ifelse(df[i] == 1, nn[i], df[i])
}

Это дает

     a    b
1 <NA>    b
2    a <NA>
3 <NA>    b
4    a    b
5    a <NA>

Relasta · Answer 3 · 02 мая 2018

Если вы хотите придерживаться решения dplyr, оно у вас почти уже есть

library(dplyr)

df <- data_frame(a = c(NA, 1, NA, 1, 1), b = c(1, NA, 1, 1, NA))

df %>% 
    transmute_all(funs(ifelse(. == 1, deparse(substitute(.)), NA)))

#> # A tibble: 5 x 2
#>     a     b    
#>   <chr> <chr>
#> 1 <NA>  b    
#> 2 a     <NA> 
#> 3 <NA>  b    
#> 4 a     b    
#> 5 a     <NA>

akrun · Answer 4 · 02 мая 2018

Один вариант: map2

library(purrr)
map2_df(df1, names(df1), ~  replace(.x, .x==1, .y))
# A tibble: 5 x 2
#  a     b    
# <chr> <chr>
#1 NA    b    
#2 a     NA   
#3 NA    b    
#4 a     b    
#5 a     NA

Или, как прокомментировал @Moody_Mudskipper

imap_dfr(df1, ~replace(.x, .x==1, .y))

В base R мы можем сделать

df1[] <- names(df1)[col(df1) *(df1 == 1)]

данные

df1 <-  data_frame(a = c(NA, 1, NA, 1, 1), b=c(1, NA, 1, 1, NA))

Замените значения столбца на имя столбца, используя dplyr transmute_all

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

данные

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Замените значения столбца на имя столбца, используя dplyr transmute_all

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

данные

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов