У меня есть следующий набор данных:
attack defense sp_attack sp_defense speed is_legendary
60 62 63 80 60 0
80 100 123 122 120 0
39 52 43 60 65 0
58 64 58 80 80 0
90 90 85 125 90 1
100 90 125 85 90 1
106 150 70 194 120 1
100 100 100 100 100 1
90 85 75 115 100 1
Из этого набора данных я хочу проверить, существует ли гетероскедастичность между двумя группами: Легендарные и нелегендарные покемоны . Для этого сначала я проверил нормальность данных для легендарных и нелегендарных покемонов следующим образом:
# Shapiro-test for legendary and non legendari pokemon, hp comparison.
shapiro.test(df_net$hp[df_net$is_legendary==0])
shapiro.test(df_net$hp[df_net$is_legendary==1])
Я видел, что в обоих случаях результат не распределяется нормально. Теперь я решил провести тест Флиннера следующим образом:
fligner.test(hp[df_net$is_legendary==0] ~ hp[df_net$is_legendary==1], data = df_net)
Однако я получаю следующую ошибку:
Error in model.frame.default(formula = hp[df_net$is_legendary == 0] ~ : variable lengths differ (found for 'hp[df_net$is_legendary == 1]')
Я предполагаю, что это связано с количество наблюдений за легендарными покемонами отличается от не легендарных, но тогда как я могу проверить гетероскедастичность между этими двумя группами?