сбой корреляции - Пирсон - PullRequest
       6

сбой корреляции - Пирсон

0 голосов
/ 26 августа 2011

Я хочу записать в файл данных информацию о корреляции следующим образом:

*korelacja=cor(p2,d2,method="pearson",use = "complete.obs")
korelacja2=cor(p2,d2,method="kendall",use = "complete.obs")
korelacja3=cor(p2,d2,method="spearman",use = "complete.obs")
dane=paste(korelacja,korelacja2,korelacja3,sep=';')
write(dane,file=nazwa,append=TRUE)*

Результаты странные для меня - корреляция Пирсона очень высокая (всегда равна единице), но у Кендалла и Спирмена очень низкая.Я создаю диаграммы рассеяния и не вижу линейной корреляции.

1 Ответ

1 голос
/ 26 августа 2011

Нетрудно воспроизвести этот шаблон, если в ваших данных есть большие выбросы, которые доминируют в корреляции Пирсона, но относительно незначительны в непараметрических подходах (Кендалла / Спирмена).Например, вот конкретный набор данных, в котором ничего не происходит, за исключением одного большого выброса:

> set.seed(1001)
> x <- c(runif(1000),1e5)
> y <- c(runif(1000),1e5)
> cor(x,y,method="pearson")
[1] 1
> cor(x,y,method="kendall")
[1] -0.02216583
> cor(x,y,method="spearman")
[1] -0.03335352

Это соответствует вашему описанию, хотя в этом случае вы должны иметь возможность видеть выбросы вваши диаграммы рассеяния ...

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...