У меня есть набор данных, в котором есть несколько идентификаторов, каждый из которых имеет два наблюдения / значения, например:
ID Test Behaviour
A12.4.2 ONE 8.64
A12.4.2 TWO 7.63
A6.3.3 ONE 1.81
A6.3.3 TWO 2.47
B12.4.1 ONE 1.17
B12.4.1 TWO 3.96
E9.4.2 ONE 13.04
E9.4.2 TWO 9.51
Я обнаружил, что для случайной выборки строк для сохранения данных как для идентификаторов, так и для данные наблюдения, связанные с теми идентификаторами, которые я могу использовать:
df[sample(nrow(df), 32), ]
Однако я изо всех сил пытаюсь найти функцию, которая гарантирует, что две меры для каждого идентификатора включены в случайный образец. В конце концов, я хотел бы случайную выборку, состоящую из 16 идентификаторов с двумя наблюдениями в каждом, всего 32 наблюдения. Кто-нибудь может помочь?