У меня есть выборочные данные 583 пациентов с сахарным диабетом 2 типа, и я хочу рассчитать 5-летнюю вероятность возникновения события для каждого пациента. Собранные переменные - это время, в течение которого переменная события подверглась цензуре через 5 лет, статус события и 38 независимых параметров.
Регрессия Кокса давала несущественные результаты для всех переменных, поэтому была применена упругая чистая регрессия, указанная для семейства Кокса.
Были использованы следующие команды в R:
library(survival)
library(glmnet)
y<-Surv(time,status)
x<- cbind(Age,Sex,Tobacco,Alcohol,Energy,HbA1c...)
y<-Surv(time,status)
fit<-glmnet(x,y,family="cox",alpha=0.5)
coef(fit)
После получения бета-коэффициентов оценка риска (RS) определяется по RS = B1 * X1 + B2 * X2 + ... + Bn * Xn. Далее я хочу рассчитать 5-летнюю вероятность события. Molnar et al. (2017) использовали формулу "1 - S (5) EXP [RS]" и Yang et al. (2007) использовал формулу "1 - S (5) EXP [RS - среднее значение RS]".
Мои вопросы:
1) Как рассчитать функцию выживания S (t) после применения glmnet? Является ли команда Surffit вариант? Ян и соавт. утверждает, что S (t) является функцией выживания в течение t лет, когда показатель риска принимает значение своего среднего значения. Как это можно определить?
2) Какую формулу лучше использовать? Я не могу найти никаких оснований для формулы, разработанной Янгом и др.
Любая помощь будет высоко оценена.