Question

У меня есть следующие данные, и я надеюсь, что вы мне поможете, так как я не смог найти свое решение по переполнению стека.

ID	Code
1	A
1	A12
2	M
3	A
2	M12
4	A12
5	M12
6	M
7	A
6	M12

Как видите, некоторые идентификаторы дублируются, а некоторые нет. Я хочу создать несколько столбцов, чтобы увидеть каждый код в определенном столбце. Желаемый результат:

ID	Code	A1	A121	M1	M121
1	A	A	N/A	N/A	N/A
1	A12	N/A	A12	N/A	N/A
2	M	N/A	N/A	M	N/A
3	A	A	N/A	N/A	N/A
2	M12	N/A	N/A	N/A	M12
4	A12	N/A	A12	N/A	N/A
5	M12	N/A	N/A	N/A	M12
6	M	N/A	N/A	M	N/A
7	A	A	N/A	N/A	N/A
6	M12	N/A	N/A	N/A	M12

Я понимаю, что вы хотите, чтобы я показал свои попытки. К сожалению, я не смог сделать это как новичок. Очень признателен за вашу помощь.

FlorianBrezina · Answer 1 · 26 января 2019

Это должно быть просто

library(tidyverse)

df <- tribble(~ID, ~Code,
              1, "A",
              1, "A12",
              2, "M",
              3, "A",
              2, "M12",
              4, "A12",
              5, "M12",
              6, "M",
              7, "A",
              6, "M12")

df %>%
  spread(key = Code, value = Code)

Результат

# A tibble: 7 x 5
     ID A     A12   M     M12  
  <dbl> <chr> <chr> <chr> <chr>
1     1 A     A12   NA    NA   
2     2 NA    NA    M     M12  
3     3 A     NA    NA    NA   
4     4 NA    A12   NA    NA   
5     5 NA    NA    NA    M12  
6     6 NA    NA    M     M12  
7     7 A     NA    NA    NA

Многие предпочли бы кодирование столбцов 1/0, тогда решение будет

df %>%
 mutate(bin = 1) %>%
 spread(key = Code, value = bin, fill = 0)

# A tibble: 7 x 5
     ID     A   A12     M   M12
  <dbl> <dbl> <dbl> <dbl> <dbl>
1     1     1     1     0     0
2     2     0     0     1     1
3     3     1     0     0     0
4     4     0     1     0     0
5     5     0     0     0     1
6     6     0     0     1     1
7     7     1     0     0     0

C. Braun · Answer 2 · 26 января 2019

Используя dplyr и tidyr, вы можете расширить столбец Code следующим образом:

df %>% 
    mutate(id_temp = row_number(), code_temp = Code) %>%
    spread(code_temp, code_temp) %>%
    select(-id_temp)

#    ID Code    A  A12    M  M12
# 1   1    A    A <NA> <NA> <NA>
# 2   1  A12 <NA>  A12 <NA> <NA>
# 3   2    M <NA> <NA>    M <NA>
# 4   2  M12 <NA> <NA> <NA>  M12
# 5   3    A    A <NA> <NA> <NA>
# 6   4  A12 <NA>  A12 <NA> <NA>
# 7   5  M12 <NA> <NA> <NA>  M12
# 8   6    M <NA> <NA>    M <NA>
# 9   6  M12 <NA> <NA> <NA>  M12
# 10  7    A    A <NA> <NA> <NA>

Вставка дубликатов и не дубликатов в разные столбцы в R

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Вставка дубликатов и не дубликатов в разные столбцы в R

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов