Таблица со статистикой логистической регрессии с использованием всех комбинаций столбцов предикторов - PullRequest
0 голосов
/ 27 ноября 2018

У меня есть таблица, которая выглядит следующим образом (числа полностью составлены).

Есть n переменные предиктора и 1 переменная ответа

p1 p2 p3 p4 pn r1
3  6  5  3  6  1
8  9  3  3  1  0
8  3  3  3  1  1

здесь это для ввода вR

df <- read.table(header = TRUE, text = "
p1 p2 p3 p4 pn r1
3  6  5  3  6  1
8  9  3  3  1  0
8  3  3  3  1  1
")

Я хочу сделать таблицу из псевдо Rsquared, p-значение хи-квадрат.

в виде таблицы, это будет выглядеть так (примечание: цифры составлены)

rownames p1.p2 p1.p3 ... p1.p2.p3.p4...pn
psuedoR2 .005  .006  ... .011
chi2pval .003  .004  ... .009

Как показано выше, количество предикторов будет влиять на количество столбцов.

Я пробовал что-то подобное ниже, что очень неправильно и может быть лучшеигнорировать:

 a <- apply(cbind(paste(names(df)[26],"~"),data.frame(t(combn(df[,1:4], 3)))), 1, paste, collapse="+")

 # array of pvals
 model.p <- lapply(a,FUN = function(X) glm(X, data=df, family="binomial"))$`1`

Я знаю, что много неправильного выше, например, он проходит через столбцы 1-4 вместо произвольного числа n, и мне также не ясно, как получить доступ к соответствующей статистикеи положить их в стол.Кроме того, это было бы полезно, если бы столбцы были названы предикторами, используемыми в логистической регрессии.

...