Я выбрал две выборки размером 100 из набора данных:
- Случайно и без смещения
- Смещение метод выборки
Я хочусравните каждую выборку с реальным распределением, используя ?2 (соответствие).
Это то, что я пробовал:
tbl = table(hs$general_grade)
round(prop.table(tbl),2)
sample1 = sample(hs$general_grade, 100)
sample2 = sample(hs$general_grade, 100, prob = hs$general_grade)
tbl1 = table(sample1)
round(prop.table(tbl1),2)
tbl2 = table(sample2)
round(prop.table(tbl2),2)
chisq.test(tbl1,p = prop.table(tbl))
chisq.test(tbl2,p = prop.table(tbl))
Это вывод:
real distribution:
1 2 3
0.11 0.82 0.08
sample1 distribution:
1 2 3
0.14 0.75 0.11
sample2 distribution:
1 2 3
0.05 0.84 0.11
Chi-squared test for given probabilities
data: tbl1
X-squared = 3.125, df = 2, p-value = 0.2096
Chi-squared test for given probabilities
data: tbl2
X-squared = 4.6557, df = 2, p-value = 0.0975
Я ожидалменьшие p-значения для tbl2, потому что я сделал байс к нему.Тем не менее, я не уверен, как сделать смещение в выборке в R. Правильный ли мой подход?