Пример минимального glmnet для факторов - PullRequest
0 голосов
/ 21 сентября 2018

Я пытаюсь понять, как использовать пакет R glmnet.

Предположим, у меня есть набор данных, представляющий игры, сыгранные между двумя командами, с столбцом 'win', определяющим результат.

library(RcppAlgos)
library(dplyr)

data <- RcppAlgos::permuteGeneral(c("A", "B", "C", "D", "E"), 2, repetition = TRUE) %>% 
as.data.frame() %>% setNames(c("team1", "team2")) %>% mutate(win = rbinom(25, 1, 0.5))

, где 1 обозначает, что команда 1 выиграла, а 0 обозначает, что команда 1 проиграла.

Теперь я хочу запустить эти данные через glmnet, с ответом в столбце 'won'.

Я знаю, что мне нужно использовать model.matrix с моими факторными переменными, но это неМне кажется, что это даст правильный результат.

Например:

x <- model.matrix(data$win ~ data$team1 + data$team2)
fit <- glmnet(x, data$win)

Может кто-нибудь помочь?

Спасибо!

...