Распространение данных на основе нескольких ключевых переменных - PullRequest
0 голосов
/ 03 января 2019

Мои данные:

df <- as.data.frame(cbind(Bilagstoptekst = c("A", "A", "A", "B", "B", "C", "D", "E", "E", "F", "F", "F", "F", "F"), 
              AKT=c("80", "80", "80", "80", "80", "25", "80", "80", "80", "80", "80", "25", "25", "80"), 
              IArt=c("HUVE", "HUVE", "HUVE", "HUVE", "HUBO", "BILÅ", "HUBO", "HUVE", "HUVE", "HUBO", "HUVE", "BILÅ", "BILÅ", "HUBO" ),
              Belob=c(1,2,3,4,5,6,7,8,9,10,11,12,13,14)))

> df
Bilagstoptekst AKT IArt Belob
A               80 HUVE     1
A               80 HUVE     2
A               80 HUVE     3
B               80 HUVE     4
B               80 HUBO     5
C               25 BILÅ     6
D               80 HUBO     7
E               25 HUVE     8
E               80 HUVE     9
F               80 HUBO    10
F               80 HUVE    11
F               25 BILÅ    12
F               25 BILÅ    13
F               80 HUBO    14

Теперь я хотел бы распространить свой столбец Белоб для каждой клавиши комбинации Bilagstoptekst, AKT и IArt.

Выходные данные должны быть такими:

Bilagstoptekst AKT IArt Belob1 Belob2 Belob3 
A               80 HUVE     1     2      3
B               80 HUVE     4    NA     NA
B               80 HUBO     5    NA     NA
C               25 BILÅ     6    NA     NA
D               80 HUBO     7    NA     NA
E               80 HUVE     8     9     NA
F               80 HUBO    10    14     NA
F               80 HUVE    11    NA     NA
F               25 BILÅ    12    13     NA

Итак, я пробовал с помощью распространения и dcast, но я просто не могу заставить его работать.

В моем реальном наборе данных у меня тысячи строк, так что это всего лишь примерные данные.

1 Ответ

0 голосов
/ 03 января 2019

Вот способ использования dcast из data.table

library(data.table)
dt <- as.data.table(df)
dt[, idx := rowid(Bilagstoptekst, AKT, IArt)] # creates the timevar
out <- dcast(dt, 
             Bilagstoptekst + AKT + IArt ~ paste0("Belob", idx),
             value.var = "Belob")
out
#   Bilagstoptekst AKT IArt Belob1 Belob2 Belob3
#1:              A  80 HUVE      1      2      3
#2:              B  80 HUBO      5   <NA>   <NA>
#3:              B  80 HUVE      4   <NA>   <NA>
#4:              C  25 BILÅ      6   <NA>   <NA>
#5:              D  80 HUBO      7   <NA>   <NA>
#6:              E  80 HUVE      8      9   <NA>
#7:              F  25 BILÅ     12     13   <NA>
#8:              F  80 HUBO     10     14   <NA>
#9:              F  80 HUVE     11   <NA>   <NA>

Здесь важен столбец idx, который мы создали и который служит «временным интервалом», когда мы изменяем ваши данные.


В base R вам нужно будет сделать

df$idx <- with(df, ave(Belob, Bilagstoptekst, AKT, IArt, FUN = seq_along))
reshape(df, idvar = c("Bilagstoptekst", "AKT", "IArt"), timevar = "idx", direction = "wide")

Подход tidyverse оставлен в качестве упражнения;)


Не уверен, если ваш вопрос является дубликатом Транспонировать / изменять структуру данных без «timevar» из длинного в широкий формат .

...