Рассчитать значимость корреляции в сгруппированных данных с dplyr - PullRequest
4 голосов
/ 06 февраля 2020

Я сгруппировал данные, для которых я хотел бы проверить несколько базовых c статистических данных логического вывода.

library(tidyverse)

df <- data.frame(x=runif(50, min = 0, max = 25),y=runif(50, min = 10, max = 25), group=rep(0:1,25))

df %>%
  group_by(group) %>%
  summarize(cor(x,y))

Здесь я легко могу получить корреляцию, но мне также нужно проверить ее статистическую значимость. К сожалению, параметры типа cor.test не работают в dyplr. Есть ли простой обходной путь?

1 Ответ

5 голосов
/ 06 февраля 2020

Может ли это быть тем, что вы хотите?

df %>%
    group_by(group) %>%
    summarize(cor.test(x,y)[["p.value"]])

Дело в том, что cor.test() возвращает список, а не одно значение, поэтому вам нужно выбрать элемент из списка, который вас интересует в.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...