Как я могу сделать логистическую модель с этими данными? - PullRequest
0 голосов
/ 27 апреля 2019

http://www.statsci.org/data/oz/snails.txt

Вы можете получить данные здесь.

Мои данные - это 4 * 3 * 3 * 2 полностью рандомизированных данных эксперимента по проектированию. Я хочу смоделировать вероятность выживания с точки зрения переменных стимула.

Я попробовал ANOVA, но я не уверен, правильно это или нет. Поскольку я хочу смоделировать «вероятность», я должен использовать логистическую модель? (Я также пробовал логистическую модель. Но данные показывают сумму 0 (выжили) и 1 (смерти). Даже если это не 0 и 1, могу ли я использовать логистику ??)

Я хочу поставить «вероятность» как переменную Y. Так что я использовал логит, но он не работает. Программа говорит, что у есть Инф.

Как я могу использовать logit в качестве переменной Y в aov?

glm_a <- glm(Deaths ~ Exposure + Rel.Hum + Temp + Species, data = data,
         family = binomial)    

prob <- Deaths / 20
logitt <- log(prob / (1 - prob))
logmodel <- lm(logitt ~ data$Species + data$Exposure + data$Rel.Hum + data$Temp)
summary(logmodel)


A <- factor(data$Species, levels = c("A", "B"), labels = c(-1, 1))
glm_a <- glm(Y ~ data$Species * data$Exposure * data$Rel.Hum * data$Temp,
             data=data, family = binomial)
summary(glm_a)

1 Ответ

0 голосов
/ 27 апреля 2019

help("glm") должен направить вас к help("family"), что показывает следующее

Для биномиальных и квазибиномиальных семейств ответ можно указать одним из трех способов:

  1. Как фактор: «успех» интерпретируется как фактор, не имеющий первого уровня (и, следовательно, обычно имеющий второй уровень).

  2. Как числовой вектор со значениями от 0 до 1, интерпретируемый как доля успешных случаев (с общим числом случаев, заданным весами).

  3. В виде целочисленной матрицы из двух столбцов: в первом столбце указано количество успешных операций, а во втором - количество неудач.

Итак, на вопрос «Как я могу создать логистическую модель с этими данными?», Мы можем довольно легко перейти к маршруту № 3:

data <- read.table("http://www.statsci.org/data/oz/snails.txt", header = TRUE)
glm_a <- glm(cbind(Deaths, N - Deaths) ~ Species * Exposure * Rel.Hum * Temp,
             data = data, family = binomial)
summary(glm_a)
# [output omitted]

Что касается вопроса «Я попробовал ANOVA, но я не уверен, правильно ли это или нет. Поскольку я хочу смоделировать« вероятность », должен ли я использовать логистическую модель?», Лучше задать на Перекрестная проверка

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...