В настоящее время я борюсь с анализом выживаемости с использованием R. У меня есть подходящая модель Кокша, но тест Сокс.zph показал, что одна объясняющая переменная нарушает предположение о пропорциональной опасности. Итак, вот детали: модель устанавливается следующим образом: coxph (Surv (время, цензура) ~ plasti c* week, TS), а week - это переменная, вызывающая проблему. Это числовое значение c, обозначающее неделю, в которую были собраны данные, - 1, 2, 3 или 4. Plasti c - это просто plasti c. Время дискретно - принимает значение 24 или 48 часов. Цензура равна 0 или 1 (живым или мертвым).
После долгих поисков в гугле и погружении в нос по довольно чертовски глубокой кроличьей норе, которая является этой загадкой, я быстро понял, что делать. Я думаю, что дискретный режим может быть лучшим, я видел, что некоторые игры были сделаны, но у меня нет опыта работы с GAM, и я хотел бы избежать их, если это возможно. Но эта ссылка использует их, которые я использовал, чтобы попробовать некоторые вещи - https://arxiv.org/pdf/1704.04087.pdf. Эта ссылка также показывает некоторые диагностические c графики, но я не вижу, как они их получили, поскольку они не показывают код.
Я читал о моделях ускоренных сбоев, но не уверен, что они правы. Я также смотрел на использование функции cloglog в биномиальном glm со смещением = log (время), но я не знаю точно, как это работает или как интерпретировать этот вывод. Была предложена функция страт в coxph, но я не уверен, что этот подход правильный, учитывая, что взаимодействие между пластами c неделя желательно сохранить, но добавив, скажем, coxph (Surv (время, цензура) ~ пласти c страты (неделя), TS), все еще оценивает взаимодействие и полностью удаляет переменную недели - я не знаю, как это работает.
Я также попытался разделить данные следующим образом: NewData <- SurvSplit (Surv (время, цензура) ~., Данные = данные, вырезать = c (24), id = "id") и затем запустить это: coxph (Surv (tstart, time, censored) ~ plasti c* week, TS2) по рекомендации этой виньетки - <a href="https://cran.rstudio.com/web/packages/survival/vignettes/timedep.pdf" rel="nofollow noreferrer">https://cran.rstudio.com/web/packages/survival/vignettes/timedep.pdf. Но это не исправило предположение, поэтому я мог что-то здесь упустить.
Мне очень нужна ваша помощь в выяснении того, что я должен сделать, чтобы правильно проанализировать данные, полученные в результате этого предположения. Это может быть много вопросов, но если кто-то знает, что делать, некоторый код был бы действительно хорош для модели, но также были бы полезны любые соответствующие графики диагностики c, и тесты значимости для переменных, оцененных в модели, были бы очень благодарны. Не стесняйтесь указывать мне на некоторые документы / онлайн-ресурсы, хотя я думаю, что на данный момент я исчерпал большинство онлайн-ресурсов.
Так что да, это моя загадка. Мои руководители проектов не знают, что делать, как и другие в моем отделе, так что вы, ребята, моя последняя надежда. Я даю более подробную информацию о данных и c, если это необходимо. И не стесняйтесь делать мне выговор, если я нарушил правила subreddit. Я также работаю при условии, что это не было опубликовано ранее, так как я не получил ничего из всех моих предыдущих поисков в отношении проблемы. Извините, если это дублирующий вопрос. В любом случае, спасибо, что прочитали, если ничего другого:)