есть ли код R для следующей обработки и преобразования данных - PullRequest
0 голосов
/ 01 августа 2020

У меня есть следующий набор данных

id<-c(1,1,1,1,2,2,2,2,2,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4)
s02<-c(001,002,003,004,001,002,003,004,005,001,002,003,004,005,006,007,001,002,003,004,005,006,007,008,009,010,011,012,013,014,015,016,017,018,019,020,021,022,023,024,025,026,027,028,029)
dat1<-data.frame(id,s02)

Я бы хотел sh создать набор данных на основе этого dat1. Я бы wi sh имел код R, который автоматически создает n s02 как s02__0, s02__1, s02__2, s02__3, s02__4, и в этом случае мой n == 5. Затем на основе идентификатора в dat1 код должен назначить каждый s02 соответствующим s02__0 - s02__4 в кадре данных. Эти строки однозначно идентифицируются другим идентификатором ID_2, созданным на основе количества строк. Если в созданной строке s02 меньше, то оставшиеся ячейки должны быть выделены ## N / A ##. если s02 больше, чем n, то формируется другая новая строка с приращением от уникального ID_2 для размещения дополнительных s02, и каждая пустая ячейка по-прежнему заполняется ## N / A ##. Из вышеприведенного набора данных я бы хотел sh получить следующий результат

id<-c(1,2,3,3,4,4,4,4,4,4)
id_2<-c(1,1,1,2,1,2,3,4,5,6)
s02__0<-c(1,1,1,6,1,6,11,16,21,26)
s02__1<-c(2,2,2,7,2,7,12,17,22,27)
s02__2<-c(3,3,3,##N/A##,3,8,13,18,23,28)
s02__3<-c(4,4,4,##N/A##,4,9,14,19,24,29)
s02__4<-c(##N/A##,5,5,##N/A##,5,10,15,20,25,##N/A##)

dat2<-data.frame(id,id_2,s02__0,s02__1,s02__2,s02__3,s02__4)

1 Ответ

1 голос
/ 01 августа 2020

Это может произвести то, что вы хотите:

library(tidyverse)
#Data
id<-c(1,1,1,1,2,2,2,2,2,3,3,3,3,3,3,3)
s02<-c(001,002,003,004,001,002,003,004,005,001,002,003,004,005,006,007)
dat1<-data.frame(id,s02)
#Code
dat2 <- dat1 %>% group_by(id) %>% mutate(id2 = ifelse(s02<=5,1,2)) %>% ungroup() %>%
  group_by(id,id2) %>% mutate(val=1:n()-1,nid = cur_group_id()) %>% ungroup() %>%
  select(-id2) %>% mutate(id=paste0(id,'.',nid),val=paste0('s02','.',val)) %>% select(-nid) %>%
  pivot_wider(names_from = c(val),values_from = s02) %>%
  mutate(id=gsub("\\..*","", id)) %>% group_by(id) %>%
  mutate(id2=1:n()) %>% select(order(colnames(.)))
dat2

# A tibble: 4 x 7
# Groups:   id [3]
  id      id2 s02.0 s02.1 s02.2 s02.3 s02.4
  <chr> <int> <dbl> <dbl> <dbl> <dbl> <dbl>
1 1         1     1     2     3     4    NA
2 2         1     1     2     3     4     5
3 3         1     1     2     3     4     5
4 3         2     6     7    NA    NA    NA
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...