У меня есть две полиномиальные переменные (например, возрастная группа и цвет).
ageGroup <- c(35,40,45,50)
color <- c("Red", "Blue", "Yellow")
Я хочу иметь возможность нарисовать эти две переменные для 100 наблюдений с равной вероятностью.
n = 100
age <- sample(ageGroup, 100, replace = T)
color <- sample(color, 100, replace = T)
Если мы предположим, что из некоторой наблюдаемой таблицы частот видно, что возраст 35 и 40 лет также не может быть «красным», как мне выбрать, где эти две возрастные группы имели бы одинаковую вероятность изобразить «синий» и «желтый» (а не «красный»)?)?
Стоит ли разбивать выборку по возрастным группам или есть более сложный статистический подход?
Спасибо!