У меня есть этот фрейм данных:
df <- data.frame(id = 1:1000,
data = sample(300:500, 1000, replace=TRUE),
check.names = FALSE)
> head(df)
id data
1 1 488
2 2 412
3 3 465
4 4 388
5 5 353
6 6 333
Где каждый data
является мерой для каждого id
, и я хочу знать, если data
для каждого id
имеют тенденцию быть похожимиили нет. Для этого я собираюсь провести тест на гипотезу, где нулевая гипотеза отклоняется, если data
имеют тенденцию быть разными для каждого id
. Как мне сделать эту тестовую гипотезу в R? Имеет ли значение, если data
являются дискретными или непрерывными числами?
РЕДАКТИРОВАТЬ
Вопрос, который я пытаюсь решить с помощью этого теста, заключается в том, является ли data
за id
имеют тенденцию быть похожими или разными? Есть ли статистический тест, который я мог бы использовать для этого? Или просто пытаетесь построить график и сгруппировать разные идентификаторы?