нумерация записей в сгруппированных данных - PullRequest
0 голосов
/ 24 июня 2018

Мне нужно пометить записи, когда определенное условие соответствует, например, внутри сгруппированных данных, когда sw1=='q' & type=='good' его a record_1 и record_1 необходимо повторять до следующего нажатия sw1=='q' &type=='good'.

Вот что я имею в виду

df <- data.frame(gr = rep(letters[1:2],each=8), 
             sw1=rep(c(letters[17:20],sw2=letters[c(17,21,17,23)]),2),

             type =c(c("good", "bad",'Visky','Wine',"good", "good","Visky","bad"),c("good","Wine","Visky","bad","good","Visky","good","bad")))

    gr sw1  type
1   a   q  good   #record 1
2   a   r   bad
3   a   s Visky
4   a   t  Wine
5   a   q  good   #record 2
6   a   u  good
7   a   q Visky
8   a   w   bad
9   b   q  good   #record 1
10  b   r  Wine
11  b   s Visky
12  b   t   bad
13  b   q  good   #record 2
14  b   u Visky
15  b   q  good   #record 3
16  b   w   bad

Итак, я попытался следовать

library(dplyr)


df%>%
  group_by(gr)%>%
  mutate(label=cummax(type=="good"&sw1=="q"))

, который выдает

# A tibble: 16 x 4
# Groups:   gr [2]
   gr    sw1   type  label
   <fct> <fct> <fct> <int>
 1 a     q     good      1
 2 a     r     bad       1
 3 a     s     Visky     1
 4 a     t     Wine      1
 5 a     q     good      1
 6 a     u     good      1
 7 a     q     Visky     1
 8 a     w     bad       1
 9 b     q     good      1
10 b     r     Wine      1
11 b     s     Visky     1
12 b     t     bad       1
13 b     q     good      1
14 b     u     Visky     1
15 b     q     good      1
16 b     w     bad       1

, ноожидаемый результат -

   gr    sw1   type  label   record
 1 a     q     good      1   record_1
 2 a     r     bad       1   record_1 
 3 a     s     Visky     1   record_1
 4 a     t     Wine      1   record_1
 5 a     q     good      2   record_2 
 6 a     u     good      2   record_2
 7 a     q     Visky     2   record_2
 8 a     w     bad       2   record_2
 9 b     q     good      1   record_1
10 b     r     Wine      1   record_1
11 b     s     Visky     1   record_1
12 b     t     bad       1   record_1
13 b     q     good      2   record_2
14 b     u     Visky     2   record_2
15 b     q     good      3   record_3
16 b     w     bad       3   record_3

, забыл упомянуть, я также пытался dense_rank, но выход даже не близок к ожидаемому.

Ответы [ 2 ]

0 голосов
/ 24 июня 2018

Вы должны использовать cumsum, как показано ниже:

library(tidyverse)

df%>%
    group_by(gr)%>%
    mutate(label=cumsum(type=="good"&sw1=="q")+0L,
           record = paste0("record_",label))
0 голосов
/ 24 июня 2018

Вы можете попробовать:

library(dplyr)


df%>%
  group_by(gr)%>%
  mutate(label=cumsum(type=="good"&sw1=="q"))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...