Я хочу сделать непарный t-тест, чтобы проверить, отличаются ли значения между сайтами в каждой типе категории.
Так что мой вопрос в том, в типах (AB или CD), отличаются ли значения (значение A или значение B) между сайтами (A или B)?
Вот пример моих данных:
dat <- data.frame(
"site" = c("A","B","B","A","A","B","B","A"),
"type" = c("AB","CD"),
"valueA" = c(13,-10,-5,18,-14,12,-17,19),
"valueB" = c(-3,20,15,-16,12,15,-11,14)
)
dat
site type valueA valueB
A AB 13 -3
B CD -10 20
B AB -5 15
A CD 18 -16
A AB -14 12
B CD 12 15
B AB -17 -11
A CD 19 14
Я пытаюсь выполнить четыре непарных t-теста для проверки:
- Если значение A Тип AB , отличается между сайтом A и сайтом B
- Если значение B Тип AB, отличается между сайтом A и сайтом B
- Если значение A Type CD, отличается между сайтом A и сайтом B
- Если значение типа CD CD отличается между сайтом A и сайтом B
Чтобы выполнить непарный t-критерий, я считаю, что мне нужно перестроить свои данные так, чтобы тип AB и Тип CB и сайт A и сайт B - это каждый столбец (вместо того, чтобы находиться внутри столбца типа или сайта).
РЕДАКТИРОВАТЬ:
Используя предложенный код в комментариях:
library(dplyr)
d %>%
group_by(site, type) %>%
summarise(pval = t.test(valueA, valueB)$p.value)
Выход это:
site type pval
A AB 0.784
A CD 0.417
B AB 0.492
B CD 0.365
Насколько я понимаю, это p-значение здесь дает мне разницу между значением A и значением B.
Я ищу, например: разницу между сайтом A и сайтом B значения A в типе CD.
Так что, если я правильно думаю, выходные данные t-теста должны иметь столбец для типа, значения A и значения B. Тогда значения p предназначены для различий между сайтами.
Аналогично этому:
type valueA valueB
AB 0.365 0.784
CD 0.492 0.417
Имеет ли это смысл?