Я недавно начал читать о tmle и SuperLearner , и я пытаюсь запустить tmle для данных о выживании, используя пакет tmle в R .Я нашел пример кода в книге Марка Дж. Ван дер Лаана и Шерри Роуз Targeted Learning , в которой для запуска требуется преобразование данных в длинный формат.Функция, которая преобразует данные в длинный формат, больше не доступна.Вот код:
## Expand subLung to Long Format
longData <- SuperLearner:::createDiscrete(time =
subLung$time, event = (subLung$status == 2),
dataX = subset(subLung, select =
-c(time, status)), n.delta = 30)
Я думаю, функция createDiscrete
больше не доступна в пакете SuperLearner .Есть ли другая функция, которая преобразует данные в длинный формат?Если нет, то очень полезен пример того, как преобразовать данные в соответствующий длинный формат.
Насколько я понимаю, SuperLearner требует специальной структуры данных для результата выживания, а необычные данные длинного формата, которые мы используем для продольного результата.В приведенном выше коде аргумент n.delta
, который я предполагаю, разбивает наблюдаемое время отказа на 30 интервалов, а затем подсчитывает количество ошибок (и цензуру).В книге Targeted Learning авторы упоминают, что
Первым шагом было преобразование структуры данных с цензурой справа (W, Δ, T) в продольную структуру данных.сбор в момент времени t изменений в процессах подсчета, dN (t), dA (t): (W, (dN (t), dA (t): t)).Сетка из 30 временных точек была создана с использованием квантилей наблюдаемых времен смерти, а затем dN (t) было определено как число наблюдаемых отказов в окне, содержащем t, и, аналогично, dA (t) было определено как числонаблюдаемых событий цензуры в этом окне.
Но я все еще борюсь со структурой данных.