Ошибка при построении корреляционного теста с использованием пакета ggpubr в R - PullRequest
1 голос
/ 18 марта 2019

Это образец набора данных, над которым я работаю, где я выполняю корреляционный тест Пирсона между переменными step и z:

> head(datacorr)
  Date & Time [Local]  Latitude Longitude     step   x   y         z
1 2018-06-18 15:32:00 -2.436589  34.81398 4410.099  14  10  18.24621
2 2018-06-18 15:36:00 -2.438691  34.81222 4620.307  11  15  18.60108
3 2018-06-18 15:40:00 -2.438472  34.81164 4682.904 112 164 198.84468
4 2018-06-18 15:44:00 -2.437794  34.81141 4702.586  90 278 293.42787
5 2018-06-18 15:48:00 -2.437766  34.81177 4662.585  11   7  13.05272
6 2018-06-18 15:52:00 -2.437416  34.81284 4541.207  16   2  16.17849

У меня нет проблем с запуском теста и созданием базового plot(), но я хотел бы получить более подробную визуализацию с использованием ggscatter() из пакета ggpubr. Вот мой сценарий с его выводами:

> corre<-cor.test(datacorr$step, datacorr$z, method=c("pearson"))
> print(corre)

    Pearson's product-moment correlation

data:  datacorr$step and datacorr$z
t = -6.2382, df = 15021, p-value = 4.546e-10
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 -0.06676964 -0.03487023
sample estimates:
       cor 
-0.0508329 

> plot(datacorr$step,datacorr$z)
> step<-datacorr$step
> activityz<-datacorr$z
> library("ggpubr")
> ggscatter(datacorr, x = step, y = activityz, 
+           add = "reg.line", conf.int = TRUE, 
+           cor.coef = TRUE, cor.method = "pearson",
+           xlab = "Step Length", ylab = "Activity Z")
Error in .check_data(data, x, y, combine = combine | merge != "none") : 
  Can't find the y elements in the data.

Я использовал код ggscatter(), основанный на другом посте. Кто-нибудь знает, почему я продолжаю иметь ошибки? Я новичок в R, но мне кажется, что я правильно определяю все аргументы. Если у вас есть какие-либо альтернативы для визуализации корреляционных тестов Пирсона в R (с указанием линии, коэффициента r, значения p и т. Д.), Я открыт для предложений.

Любая помощь приветствуется!

1 Ответ

3 голосов
/ 18 марта 2019

Примеры в документации функции ggscatter показывают, что вы должны передавать аргументы x и y в виде строк. В документации также говорится (как ответ на ваш комментарий выше), что вы можете использовать add.params для стилизации линии регрессии.

Попробуйте это:

ggscatter(datacorr, x = 'step', y = 'z', 
          color = 'red',   # for the points
          add = "reg.line", 
          add.params = list(color = "blue", fill = "lightgray"),  # for the line
          conf.int = TRUE, 
          cor.coef = TRUE, cor.method = "pearson",
          xlab = "Step Length", ylab = "Activity Z")

Используемые данные:

datacorr <- read.table(text = "Date Time  Latitude Longitude     step   x   y         z
1 2018-06-18 15:32:00 -2.436589  34.81398 4410.099  14  10  18.24621
2 2018-06-18 15:36:00 -2.438691  34.81222 4620.307  11  15  18.60108
3 2018-06-18 15:40:00 -2.438472  34.81164 4682.904 112 164 198.84468
4 2018-06-18 15:44:00 -2.437794  34.81141 4702.586  90 278 293.42787
5 2018-06-18 15:48:00 -2.437766  34.81177 4662.585  11   7  13.05272
6 2018-06-18 15:52:00 -2.437416  34.81284 4541.207  16   2  16.17849
", header = TRUE)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...