Различная длина - fligner.test - PullRequest
0 голосов
/ 29 мая 2020

У меня есть следующий набор данных:

attack defense sp_attack sp_defense speed is_legendary
 60      62      63      80          60         0
 80      100    123      122         120        0
 39      52      43      60          65         0
 58      64      58      80          80         0
 90      90      85      125         90         1
100      90      125     85          90         1
106      150     70      194         120        1
100      100    100      100         100        1
90       85      75      115         100        1

Из этого набора данных я хочу проверить, существует ли гетероскедастичность между двумя группами: Легендарные и нелегендарные покемоны . Для этого сначала я проверил нормальность данных для легендарных и нелегендарных покемонов следующим образом:

# Shapiro-test for legendary and non legendari pokemon, hp comparison.
shapiro.test(df_net$hp[df_net$is_legendary==0])
shapiro.test(df_net$hp[df_net$is_legendary==1])

Я видел, что в обоих случаях результат не распределяется нормально. Теперь я решил провести тест Флиннера следующим образом:

fligner.test(hp[df_net$is_legendary==0] ~ hp[df_net$is_legendary==1], data = df_net)

Однако я получаю следующую ошибку:

Error in model.frame.default(formula = hp[df_net$is_legendary == 0] ~ : variable lengths differ (found for 'hp[df_net$is_legendary == 1]')

Я предполагаю, что это связано с количество наблюдений за легендарными покемонами отличается от не легендарных, но тогда как я могу проверить гетероскедастичность между этими двумя группами?

1 Ответ

1 голос
/ 29 мая 2020

Правильный синтаксис для fligner.test -

fligner.test(x ~ group, data)

В вашем случае правильный синтаксис будет (например, для переменной sp_defense)

fligner.test(sp_defense ~ is_legendary, data=df_net)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...