Является ли метод ускоренного времени отказа (AFT) приемлемым для ответа на мой учебный вопрос (пример)? - PullRequest
0 голосов
/ 13 апреля 2020

Мне нужно провести скорректированный анализ выживаемости, однако предположение Кокс-ЛГ не было выполнено, и стратификация данных не является хорошим решением, поскольку в одной из моих исследовательских групп уже есть небольшое количество пациентов. Таким образом, я попытался соответствовать своей первой модели AFT, однако я не уверен, все ли в порядке. Можно ли использовать следующий подход для ответа на мой вопрос исследования?

Вопрос исследования: для сравнения скорректированной выживаемости двух групп пациентов, A (n = 11000) и B (n = 50)

Время наблюдения: 460 дней

Переменные, используемые для корректировки: возраст (50-100), пол (м / ж), сопутствующая патология (целое число) , 0-12)

Подход, который я использовал (мое текущее лучшее понимание AFT)

1. Я запускаю модели AFT с разными дистрибутивами (здесь я показываю только две модели, чтобы уменьшить длину этого поста)

library(flexsurv)
fit_genf = flexsurvreg(Surv(time, status) ~ group, dist="genf", data = data)
fit_llogis = flexsurvreg(Surv(time, status) ~ group, dist="llogis", data = data)

2. Затем я строю модели для оценки их соответствия данным и выбираю лучшее

plot(fit_genf)

Сюжет: Обобщенная модель F-распределения AFT

plot(fit_llogis)

Сюжет: Logisti c шкала распределения AFT, модель

3. Затем я проверяю их логарифмические вероятности и выбираю лучшее

fit_genf$loglik

-29540.38

fit_llogis$loglik

-29748.55

4. РЕЗУЛЬТАТ: Обобщенное F-распределение AFT-моделирование (fit_genf) является приемлемым методом для моего анализа, так как он имел наилучшее соответствие и лучшую логарифмическую вероятность. Или что-то не так в моем подходе (большое число AI C, логарифмическое правдоподобие et c)?

Полная сводка модели fit_genf:

Call:
flexsurvreg(formula = Surv(time, status) ~ group, data = data, 
    dist = "genf")

Estimates: 
        data mean  est       L95%      U95%      se        exp(est)
mu            NA    4.82150   4.29511   5.34788   0.26857        NA
sigma         NA    2.37833   1.89590   2.98351   0.27509        NA
Q             NA   -2.79284  -3.71926  -1.86641   0.47267        NA
P             NA    2.22999   1.05947   4.69368   0.84675        NA
groupB   0.00433    0.62147  -0.29332   1.53627   0.46674   1.86167
        L95%      U95%    
mu            NA        NA
sigma         NA        NA
Q             NA        NA
P             NA        NA
groupB   0.74578   4.64721

N = 11541,  Events: 3851,  Censored: 7690
Total time at risk: 4024558
Log-likelihood = -29540.38, df = 5
AIC = 59090.77
...