Я случайно выбрал 100 строк из моего кадра данных (содержащего 20 строк) в широком формате.Я использовал этот код r:
random_100 <- df.wide[sample(nrow(df.wide), 100, replace = T),]
. Он возвращает кадр данных, содержащий 100 строк (каждый с идентификатором пациента, результатом лечения, терапевтическим альянсом), в котором идентификатор пациента может повторяться.Это здорово, потому что это то, что я хотел.
Поскольку меня интересуют продольные эффекты, мне теперь нужно извлечь соответствующие строки (на основе идентификатора пациента) из моего длинного формата данных.Я попробовал следующий код:
random_long <- subset(df.long, (df.long$id %in% random_100$id))
Однако я не принимаю 100 пациентов (* продолжительность лечения), а только 20 пациентов.
Какой код мне нужно использовать, чтобы разрешитьПациент должен быть взят из длинного формата данных так часто, как это было случайно выбрано из моего широкоформатного кадра данных?
Надеюсь, мой вопрос достаточно ясен.