1
Предположим, что я выбрал 4 независимых набора данных из разных, одномерных нормальных распределений: data1, data2, data3 и data4.
Я хочу проверить, имеют ли данные1 и данные2 более близкие значения по сравнению с данными3 и данными4, например, если
|m_1 - m_2| < |m_3 - m_4|
На самом деле, проблема в том, что у меня нет пар, поэтому корреляции не работают. Я действительно хочу проверить расстояние между средними значениями, а не парными значениями. Я думал определить следующую переменную Zij:
if m_i - m_j > 0 (=> use a ttest): Z_ij = x_i - x_j
elseif m_i - m_j < 0: Z_ij = x_j - x_i
where x_i ~ N(m_i, s_i), x_j ~ N(m_j, s_j).
Тогда, если ошибка в оценке знака мала:
Z_ij ~ N(|m_i - m_j|, sqrt(sigma_i^2+sigma_j^2)).
В конце я также могу сравнить Z_12 и Z_34 с тестом.
Верно ли, если я делю свою альфа на 3 для тестов t (x_1 - x_2), t (x_3 - x_4) и t (z_12 - z_34)?
Как вы думаете, это работает?
Заранее спасибо