Почему кривая выживания составляет до 100%, когда менее 50% опыта происходит? - PullRequest
2 голосов
/ 19 марта 2020

Эта проблема смутила меня больше часов, чем я хочу признаться. Я выделил проблему, чтобы я мог ее воспроизвести.

library(survival)
library(survminer)

set.seed(123)
test <- data.frame(rnorm(10000)+5,
                   sample(0:1, 10000, replace = TRUE))

colnames(test)<- c("time", "event")
#sum(test$event) = 4975
survfitted <- survfit(Surv(time = time, event = event) ~ 1,
                      data = test)
plot(survfitted, fun = "event")

Почему эта кривая составляет до 100%, когда только 49,75% испытывают событие? Каков будет правильный синтаксис для построения графика, показывающего совокупную долю заболеваемости?

Проблема заключается в том, что цензура рассматривается как событие.

1 Ответ

0 голосов
/ 25 марта 2020

Если все события цензуры происходят до последнего события, то последнее событие примет кривую КМ до 0, или, как в этом случае, примет кривую опасности до 1,0. (График представляет собой оценку опасности, а не выживаемости в КМ.)

При моделировании события и цензура были распределены чрезвычайно равномерно, поэтому почти на любом таком графике функция опасности будет приближаться к 1. Если вы выбрали Ваше семя как 9, вы получаете участок, где он не совсем достигает нуля.

set.seed(9)
png(); plot(survfitted, fun = "event"); abline(h=1);dev.off()

enter image description here

График опасности всегда будет приближаться к 1 если события и время цензуры распределены равномерно по одному и тому же диапазону. Причина того, что большинство медицинских примеров участков выживания или опасности заканчиваются в середине диапазона 0-1, заключается в том, что обычно существует много периодов цензуры после последнего наблюдаемого события.

...