Запуск Tmle для выживания результата в R - PullRequest
0 голосов
/ 28 сентября 2019

Я недавно начал читать о tmle и SuperLearner , и я пытаюсь запустить tmle для данных о выживании, используя пакет tmle в R .Я нашел пример кода в книге Марка Дж. Ван дер Лаана и Шерри Роуз Targeted Learning , в которой для запуска требуется преобразование данных в длинный формат.Функция, которая преобразует данные в длинный формат, больше не доступна.Вот код:

## Expand subLung to Long Format 
longData <- SuperLearner:::createDiscrete(time =
subLung$time, event = (subLung$status == 2),
dataX = subset(subLung, select =
-c(time, status)), n.delta = 30)

Я думаю, функция createDiscrete больше не доступна в пакете SuperLearner .Есть ли другая функция, которая преобразует данные в длинный формат?Если нет, то очень полезен пример того, как преобразовать данные в соответствующий длинный формат.

Насколько я понимаю, SuperLearner требует специальной структуры данных для результата выживания, а необычные данные длинного формата, которые мы используем для продольного результата.В приведенном выше коде аргумент n.delta, который я предполагаю, разбивает наблюдаемое время отказа на 30 интервалов, а затем подсчитывает количество ошибок (и цензуру).В книге Targeted Learning авторы упоминают, что

Первым шагом было преобразование структуры данных с цензурой справа (W, Δ, T) в продольную структуру данных.сбор в момент времени t изменений в процессах подсчета, dN (t), dA (t): (W, (dN (t), dA (t): t)).Сетка из 30 временных точек была создана с использованием квантилей наблюдаемых времен смерти, а затем dN (t) было определено как число наблюдаемых отказов в окне, содержащем t, и, аналогично, dA (t) было определено как числонаблюдаемых событий цензуры в этом окне.

Но я все еще борюсь со структурой данных.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...