У меня есть набор данных со значениями Да Нет для Рака. Ниже приведен пример набора данных
set.seed(42)
cancer <- sample(c("yes", "no"), 200, replace=TRUE)
agegroup <- sample(c("35-39", "40-44", "45-49"), 200, replace=TRUE)
agefirstchild <- sample(c("Age < 30", "Age 30 or greater", "nullipareous"), 200, replace=TRUE)
dat <- data.frame(cancer, agegroup, agefirstchild)
Из этого набора данных я хотел бы вычесть 5000 выборок. Каждый образец содержит 10% набора данных. Затем возьмите пропорцию значения Да Рака для каждого образца. И из 5000 значений я хотел бы составить гистограмму из 5000 пропорциональных значений из Рака Да, а также получить сводку со средним, медианой, квартилями и стандартным отклонением этой гистограммы.
Этот код ниже рассчитывается пропорция. Но теперь мне нужно это из 10% набора данных, 5000 раз и в гистограмме со сводкой
resample <- sample(dat, replace = TRUE)
proportion <- prop.table(table(resample$Cancer))
. Я могу найти несколько примеров того, как сделать это со значениями цифр c, но не с двоичными значениями , Но как я могу выполнить такой тест с двоичными значениями?