Я пытаюсь преобразовать набор данных из длинного в широкий формат. Нужно сделать это для подачи в другую программу для целей анализа. Мои входные данные ниже:
sdata <- data.frame(c(1,1,1,1,1,1,1,1,1,1,1,1,1),c(1,1,1,1,1,1,1,1,1,2,2,2,2),c("X1","A","B","C","D","X2","A","B","C","X1","A","B","C"),c(81,31,40,5,5,100,8,90,2,50,20,24,6))
col_headings <- c("Orig","Dest","Desc","Estimate")
names(sdata) <- col_headings
Входные данные

В зависимости от уникальной комбинацииOrig-Dest-X1, категория Orig-Dest-X2 выше, подкатегории различаются только от A, B, C до A, B, C, D до A, B и т. Д. Я пытаюсь получить желаемый результат (код длявоссоздать в R ниже) вместе с изображением желаемого выхода.
sdata_spread <- data.frame(c(1,1),c(1,2),c(81,50),c(31,20),c(40,24),c(5,6),c(5,NA),c(100,NA),c(8,NA),c(90,NA),c(2,NA))
col_headings <- c("Orig","Dest","X1", "X1_A", "X1_B", "X1_C", "X1_D","X2", "X2_A", "X2_B", "X2_C")
names(sdata_spread) <- col_headings
Требуемый выход

Я попробовал следующее:
sdata_spread <- sdata %>% spread(Desc,Estimate)
Ошибка, которую я получил, была:
Error: Each row of output must be identified by a unique combination of keys.
Keys are shared for 6 rows
Я также попробовал принятый ответ, приведенный здесь: Длинный к ширине без уникального ключа и здесь: Длинный к широкому формату снесколько дубликатов. Обход с уникальным списком столбцов , но он не дал мне желаемого результата.
Любое понимание будет высоко ценится.
Спасибо, Кришнан