Проблема
Проблема на самом деле с Thickness
;Легко проверить, что
fit <- coxph(Surv(Time, Event) ~ Thickness, data = rsima)
выдает предупреждение
Предупреждающее сообщение: В установщике (X, Y, strats, offset, init, control, weights = weights,: Ranиз итераций и не сходятся
Мы можем получить представление о проблемах сходимости из ?coxph
:
В некоторых случаях данных фактическая оценка коэффициента MLE равнабесконечность, например, дихотомическая переменная, в которой в одной из групп нет событий. Когда это происходит, соответствующий коэффициент растет с постоянной скоростью, и в подходящей процедуре будет существовать условие расы: либо логарифмическая вероятность сходится, информационная матрица становится фактически единственной, аргумент exp становится слишком большим для аппаратного обеспечения компьютера или превышено максимальное количество взаимодействий. (Почти всегда происходит первое.) Процедура пытается определить, когда это произошло, не всегда успешно. Основное последствие для пользователяявляется то, что статистика Вальда = коэффициент / SE (коэффициент) не является Valid в этом случае и должен игнорироваться;однако соотношение правдоподобия и оценки остаются действительными.
Объяснение
Если мы посмотрим на rsima$Thickness
, то заметим, что большинство значений невелики (в диапазоне 0.08 <= Thickness <= 0.2495
).) с одним единственным значением, равным Thickness = 0.94
.Это очень похоже на случай, описанный в документации, где Thickness
- это в основном дискретная переменная (с уровнями «низкий» и «высокий») и одна группа почти не имеет событий («высокая» группа имеет только одно событие).
Исходя из этого поста о перекрестной проверке , полезно визуализировать эффект путем построения графика
library(survminer)
ggsurvplot(survfit(Surv(Time, Event) ~ (Thickness > median(Thickness, na.rm = T)), data = df), data = df)
То, что мы здесь делаем, - это построение графика вероятности выживания как функции от дихотомического Thickness
, где Thickness
либо меньше его медианного значения (красная кривая), либо больше (синяя кривая).
Вы можете увидеть влияние Thickness
на вероятность выживания, или, скорее, отсутствие эффекта Thickness
.Например, обратите внимание, что для малых значений Thickness
нет случаев Event = 1
, а для больших значений Thickness
есть только один случай Event = 1
.
С точки зрения подгонки модели этоневозможно получить надежную оценку влияния Thickness
на вероятность выживания, и Thickness
следует удалить из модели до исследования дополнительных непрерывных / дискретных ковариат.