Я немного смущен проведением теста пропорций в R. Может быть, это супер очевидно, но prop.test
ведет себя не так, как я ожидал, и я хотел бы знать, почему и что использовать вместо этого. Приложение находится на наборе данных акций протеста.
Я построил следующий набор данных:
![enter image description here](https://i.stack.imgur.com/kYxOy.png)
, где имя относится к типу процента рассчитываемых событий. Первый ряд относится к событиям, организованным после выборов (aft_elect_prt). В каждой из этих категорий я рассчитываю количество событий, которые (past_pm1) или не были связаны с группой бывшего премьер-министра (past_pm0). Всего относится к числу событий в наборе данных определенного типа. Share0 - это last_pm0 / total, share1 - это past_pm1 / total.
Я хочу проверить нулевую гипотезу об отсутствии статистически значимой разницы между этими двумя акциями.
Чтение документации prop.test
Я настроил ее как:
prop.test(x = as.numeric(subseted$past_pm1),
n = subseted$total,
p = subseted$share0,
alternative = "two.sided",
conf.level = 0.95)
Однако это явно не проверяет то, что я хочу. Это также приводит только к одному значению p, тогда как я хотел бы извлечь значение p для каждой строки. Какую функцию / тест я должен использовать вместо этого?
Это код dput для набора данных:
structure(list(names = c("aft_elect_prt", "ANSM", "bef_elect_prt",
"big_event", "conf_viol", "coorg", "demo_petition", "economic",
"NSM", "political"), past_pm0 = c(49.66101, 78.54659, 65.57226,
49.67205, 39.641924, 69.52704, 286.8565, 68.53114, 100.00488,
117.97347), past_pm1 = c(33.796, 14.30855, 34.40608, 31.14065,
9.017051, 30.64896, 120.4515, 20.86095, 19.00836, 71.24065),
total = c(83.4570157825947, 92.8551414906979, 99.9783371835947,
80.8127028793097, 48.6589741557837, 100.176002234221, 407.307988807559,
89.3920872062445, 119.013234868646, 189.21411934495), share0 = c(0.595048954654295,
0.8459045857775, 0.655864678761227, 0.614656461548911, 0.814688856223823,
0.69404885850245, 0.704274180429913, 0.766635416419863, 0.84028368870382,
0.623491895892433), share1 = c(0.404950976057405, 0.154095398168484,
0.344135349408928, 0.385343502821669, 0.185311161125829,
0.305951119194593, 0.295725847049147, 0.233364614832964,
0.159716354412006, 0.376508107569518)), row.names = c(NA,
-10L), class = "data.frame")
Я благодарен за любые подсказки!