Лучший метод расчета и построения 95% доверительного интервала для GLM в RStudio - PullRequest
0 голосов
/ 15 июня 2019

В настоящее время я работаю над моделированием возраста появления симптомов заболевания с использованием базы данных с подробной информацией о пациенте, основанной на индивидуальной генетической информации пациента. Для этого я использовал функцию GLM RStudio, используя распределение семейства Пуассона.

Однако мне были предоставлены два разных метода расчета и построения 95% доверительных интервалов этих GLM, при этом оба результата дали совершенно разные результаты.

95% ДИ с использованием команды «confint» (Тонкий доверительный интервал - +/- 1/2 года)

Для этого метода я использую команду "confint", чтобы получить верхний и нижний пределы доверительного интервала, а затем добавить эти кривые непосредственно на график в виде y = exp (a + bx):

plot(ccmtrage~caghigh, xlab="Patient Gene Length", ylab="Symptom Age of Onset (Years)", col="grey")
mtragemodel <- glm(ccmtrage~caghigh, family="poisson")
summary(mtragemodel)
curve(exp(6.53681944-(0.06349848*x)), add=TRUE, lty=1, col="red")
confint(mtragemodel)
curve(exp(6.53681944-(0.06349848*x)), add=TRUE, lty=2, col="blue")
curve(exp(6.58285539-(0.06243501*x)), add=TRUE, lty=2, col="blue")

95% ДИ с использованием линий и стандартной ошибки подгонки (широкий доверительный интервал - +/- 5-10 лет)

Этот код основан на учебнике, который я получил по GLM во время учебы в университете. Я связался с лектором, который настаивал, что это правильно, но хотел спросить и здесь из-за разницы в результатах.

plot(ccmtrage~caghigh, xlab="Patient Gene Length", ylab="Symptom Age of Onset (Years)", col="grey")
mtragemodel <- glm(ccmtrage~caghigh, family="poisson")
xpred<-seq(36, 70 ,0.01)
ypred<-predict(mtragemodel,list(caghigh=xpred),type="response",se.fit=T)
lines(xpred,ypred$fit,col="red",lty=1, lwd=2)
lines(xpred,(ypred$fit+ypred$se.fit)*1.96,lty=3,col="blue", lwd=2)
lines(xpred,(ypred$fit-ypred$se.fit)/1.96,lty=3,col="blue", lwd=2)
summary(mtragemodel)

Мой вопрос на самом деле: какой из этих методов является правильным (или более подходящим) для расчета 95% ДИ ГЛМ?

Если 95% ДИ является более тонким из двух графиков (см. Ниже), он может быть использован для клинического использования (прогностическое тестирование и предварительное планирование вариантов лечения). Однако, если он является более широким из двух правильных графиков, это будет полезно, но вряд ли будет принято для клинического использования. Ответ на этот вопрос может сильно измениться и подход к лечению этого заболевания, поэтому любая помощь будет принята с благодарностью!

Заранее большое спасибо за любые рекомендации по этому вопросу!

Распределение данных с использованием подхода плотностного графика (GGPlot)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...