Я хочу реализовать бинарную логистическую регрессию с использованием биномиальных данных, как обсуждено здесь . Кроме того, я хочу добавить переменную, которая идентифицирует каждую двоичную точку данных, полученную в результате деагрегации одной и той же биномиальной точки данных, чтобы я мог правильно учесть их корреляцию в анализе.
Ниже я представляю результаты моих попыток. Он успешно реплицирует строки с соответствующими ковариатами, но еще не генерирует двоичную переменную. Любая помощь приветствуется.
# Структура входных биномиальных данных #
DT<-tibble::tibble(Successes = c(2,3,3), Trials=c(3,4,5), X1=c("Yes", "No", "Yes"), X2=c(10.7, 11.3, 9.9))
# A tibble: 3 x 4
Successes Trials X1 X2
<dbl> <dbl> <chr> <dbl>
2 3 Yes 10.7
3 4 No 11.3
3 5 Yes 9.9
# Мои попытки до сих пор #
DT.expanded <- DT[rep(seq(nrow(DT)), DT$Trials), ]
DT.expanded
# A tibble: 12 x 4
Successes Trials X1 X2
<dbl> <dbl> <chr> <dbl>
2 3 Yes 10.7
2 3 Yes 10.7
2 3 Yes 10.7
3 4 No 11.3
3 4 No 11.3
3 4 No 11.3
3 4 No 11.3
3 5 Yes 9.9
3 5 Yes 9.9
3 5 Yes 9.9
3 5 Yes 9.9
3 5 Yes 9.9
# Ожидаемая структура выходных двоичных данных #
# A tibble: 12 x 4
Success X1 X2
<chr> <chr> <dbl>
1 Yes 10.7
1 Yes 10.7
0 Yes 10.7
1 No 11.3
1 No 11.3
1 No 11.3
0 No 11.3
1 Yes 9.9
1 Yes 9.9
1 Yes 9.9
0 Yes 9.9
0 Yes 9.9
Заранее спасибо за любую помощь.