Оценки выживаемости Каплана-Мейера для нескольких переменных в R - PullRequest
0 голосов
/ 08 ноября 2018

Я пытаюсь найти оценки Каплана-Мейера для нескольких переменных.

У меня есть data.set, который выглядит так:

      fw_year steroid_dos status     current_dos
1   6.3271732       0.0      0        7.5-14.9 mg
24  4.5530457       0.0      0             no-use
29  0.9137577       0.0      0             no-use
33  7.3675566     367.5      0       15.0-24.9 mg
42  3.3127995       0.0      0             no-use
51  9.8288841       0.0      0          >0-4.9 mg
53  8.3696098       0.0      0          >0-4.9 mg

Я использовал код fit1<-survfit(Surv_df ~ current_dos, data = df1) для получения следующих результатов по категории.

                current_dos=no-use 
 time n.risk n.event survival std.err lower 95% CI upper 95% CI
   21    480       1    0.998 0.00208        0.994        1.000
  189    447       1    0.996 0.00305        0.990        1.000
  203    444       1    0.993 0.00378        0.986        1.000
  208    443       1    0.991 0.00438        0.983        1.000

У меня вопрос, как я могу сделать это, чтобы получить оценки Каплана-Мейера для категорий лекарств, чтобы показать результаты для каждых 1,5 и 10 лет в столбце года?

1 Ответ

0 голосов
/ 08 ноября 2018

В будущем, пожалуйста, опубликуйте ваши данные в формате, который люди смогут скопировать и вставить в консоль. Обычно люди используют dput для этого. Если вы хотите, чтобы каждый столбец имел оценку выживаемости по группам, сначала подберите соответствие и поместите результаты в data.frame. Тогда выкладывайте результаты. Если вы переключите time ~strata на strata ~ time, тогда ваш препарат будет отображаться в столбце, а не в именах столбцов.

library(survival)
library(data.table)
library(dplyr)

fit1 <- survfit(Surv(time,status)~sex,data = lung)
#get time point estimates
#just example time points for my data
#replace times with times = c(1,5,10)
sum_fit1 <- summary(fit1, times = c(150,365,800))
#put into dataframe and pull out relevant information
fit1_df <- data.frame(sum_fit1[c(2:6,8:11)],stringsAsFactors = FALSE) %>% 
    #change the strata column to make it more readable      
    mutate(strata = ifelse(strata == "sex=1", "Male","Females"))
#transpose data and columns you want in summary table
fit1_df2 <- dcast(
  setDT(fit1_df)
  , time ~ strata
  , value.var = c("n.risk"
                  ,"n.event", "surv","std.err","lower","upper")) 
...