Чао, у меня есть данные о отсеве учащихся, и я намерен провести анализ выживаемости, который, как мне кажется, я изучу или предскажу вероятность отсева из данного класса. Проблема, однако, заключается в том, что я хочу сгруппировать оценки вместе, например (7,8) (9,10) (11,12)
Вот мой реплицирующий пример. Вот данные, которые у меня сейчас есть:
data <- data.frame(STUDENT=c(1,1,1,1,2,2,2,2,3,3,3,3),
GRADE=c(9,10,11,12,7,8,9,10,9,10,11,12),
DROPOUT=c(0,0,0,0,0,0,1,1,0,0,0,1))
Я сделал данные высокими, поэтому, например, СТУДЕНТ = 1 никогда не выпадал, а СТУДЕНТ = 2 выпадал в 9-м классе, а СТУДЕНТ = 3 выпадал в 12-м классе.
Теперь вот мой основной аналитический подход к выживанию
attach(data)
survivalmodel <- Surv(time=GRADE,event=DROPOUT)
Мне нужно время2 =? Не могли бы вы сказать, насколько важно иметь это и как это возможно измерить? Я самоучка и все еще читаю.
Таким образом, мой вопрос заключается в том, как получить вероятности отсева для групп GRADE (7,8) (9,10) (11,12), чтобы в конечном итоге получить вероятность отсева учащихся в GRADES 7 и 8 отдельно для GRADES 9 и 10 отдельно для 11-го и 12-го классов.