Анализ изменения ответа в r - PullRequest
2 голосов
/ 22 октября 2019

Я пытаюсь изучить шаблоны изменения ответов на конкретные вопросы. Вот пример набора данных.

id <- c(1,1,1, 2,2,2, 3,3,3,3, 4,4)
item.id <- c(1,1,1, 1,1,1 ,1,1,2,2, 1,1)
sequence <- c(1,2,3, 1,2,3, 1,2,1,2, 1,2)
score <- c(0,0,0, 0,0,1, 0,1,0,0, 1,0)
data <- data.frame("id"=id, "item.id"=item.id, "sequence"=sequence, "score"=score)
data
   id item.id sequence score
1   1       1        1     0
2   1       1        2     0
3   1       1        3     0
4   2       1        1     0
5   2       1        2     0
6   2       1        3     1
7   3       1        1     0
8   3       1        2     1
9   3       2        1     0
10  3       2        2     0
11  4       1        1     1
12  4       1        2     0

id представляет лиц, item.id - для вопросов. sequence - попытка изменить ответ, а score - оценка предмета.

То, что я пытаюсь наблюдать, это подмножество тех, чьи score были изменены с 0 to 1 и 1 to 0. Желаемые результаты будут:

data.0.to.1
   id item.id sequence score
   2       1        1     0
   2       1        2     0
   2       1        3     1
   3       1        1     0
   3       1        2     1


data.1.to.0
    id item.id sequence score
    4       1        1     1
    4       1        2     0

Есть мысли? Спасибо!

Ответы [ 2 ]

2 голосов
/ 22 октября 2019

Я бы сделал это:

library(dplyr)
data.0.to.1 = data %>%
  group_by(id, item.id) %>%
  filter(any(diff(score) > 0))

data.1.to.0 = data %>%
  group_by(id, item.id) %>%
  filter(any(diff(score) < 0))
2 голосов
/ 22 октября 2019

Вот один из вариантов, взяв значение diff 'Score', сгруппированное по 'id', 'item.id'

library(dplyr)
data %>% 
    group_by(id, item.id) %>%
    filter(any(score != 0)) %>%
    mutate(ind = c(0, diff(score))) %>% 
    group_by(ind =  ind[ind!=0][1]) %>% 
    group_split(ind, keep = FALSE)
#[[1]]
# A tibble: 2 x 4
#     id item.id sequence score
#  <dbl>   <dbl>    <dbl> <dbl>
#1     4       1        1     1
#2     4       1        2     0

#[[2]]
# A tibble: 5 x 4
#     id item.id sequence score
#  <dbl>   <dbl>    <dbl> <dbl>
#1     2       1        1     0
#2     2       1        2     0
#3     2       1        3     1
#4     3       1        1     0
#5     3       1        2     1
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...