разные коэффициенты corrplot () и cor.test () - PullRequest
1 голос
/ 07 марта 2020

Я рассчитал коэффициент корреляции для всех возможных комбинаций набора данных о рейсах. Я сделал это сначала используя corpplot. В результате получился коэффициент 1 для комбинации часа и sched_dep_time. Однако, используя cor.test (), он сообщает, что значение приближается к 1, но равно 0.9906496.

Вот мой код:

# the corrplot
a <- flights %>% select(year, month, day, dep_time, sched_dep_time, dep_delay, arr_time, sched_arr_time, arr_delay, flight, air_time, distance, hour, minute)
corrplot(cor(na.omit(a)), method = "number")
# using cor.test
cor.test(flights$hour, flights$sched_dep_time, method = "pearson")

Чем объясняется эта разница?

1 Ответ

1 голос
/ 07 марта 2020

Это похоже на проблему округления. Когда вы делаете

library("corrplot")
corrplot(cor(na.omit(a)), method = "number", number.digits=4, number.cex=.5)

, коэффициенты лучше совпадают.

...