Построение остатков (непрерывно) против предупреждения пояснительной (категориальной) переменной: «В xy.coords (x, y, xlabel, ylabel, log): NA введены путем принуждения» - PullRequest
0 голосов
/ 11 марта 2019

Долгое время гуглер, впервые спрашиваю, извините, если мой форматирование вопроса не очень хорошее.

У меня есть тиббл, называемый ежедневно, вот вывод dput:

structure(list(Moon_Phase = c("mid", "mid", "mid", "mid", "mid", 
"new", "new", "new", "new", "new", "new", "new", "new", "new", 
"new", "new", "new", "new", "new", "new", "new", "new", "new", 
"new", "new", "new"), name = c("Al_Capone", "Al_Capone", "Bonnie", 
"Clyde", "Clyde", "Al_Capone", "Al_Capone", "Barb", "Barb", "Biggie", 
"Biggie", "Bonnie", "Bowser", "Bowser", "Doe", "Doe", "Jesse", 
"Jesse", "Lizzie", "Lizzie", "Louise", "Louise", "Roxy", "Roxy", 
"Sue", "Sue"), `date(DateTime)` = structure(c(17215, 17216, 17156, 
17155, 17156, 17133, 17134, 17161, 17162, 17157, 17158, 17156, 
17216, 17217, 17199, 17200, 17161, 17162, 17185, 17186, 17133, 
17134, 17196, 17197, 17193, 17194), class = "Date"), count = c(60970.2127659574, 
47145.2054794521, 66323.6514522822, 51168.932038835, 64211.673151751, 
75354.5454545455, 76069.5652173913, 52992, 42865.1162790698, 
63810.6870229008, 70530.612244898, 54834.2379958246, 60198.4962406015, 
56254.2056074766, 70338.4615384615, 64800, 44400, 57466.6666666667, 
54477.8761061947, 46423.8805970149, 58830.7692307692, 70478.0487804878, 
62786.4406779661, 66541.935483871, 58493.4306569343, 60781.3953488372
), avg = c(0.167566808400667, 0.0916716980460977, 0.169983135592288, 
0.0950009067366473, 0.172076034264729, 0.195215802633862, 0.213308643950517, 
0.160601492425918, 0.0352463837761031, 0.181835110358351, 0.175611555735529, 
0.102218432032213, 0.141489253083123, 0.129562604439575, 0.169391188107789, 
0.148380507250866, 0.158557388456314, 0.146077250703009, 0.120220050003983, 
0.0801402704143268, 0.15458396257616, 0.192381143851207, 0.165149903514201, 
0.138869248196884, 0.137792634329098, 0.15698540693065)), class = c("grouped_df", 
"tbl_df", "tbl", "data.frame"), row.names = c(NA, -26L), vars = c("Moon_Phase", 
"name"), drop = TRUE)

Я создал линейную модель:

m0 <- lm(count ~ Moon_Phase, data = daily)

Я хочу проверить независимость моей модели, поэтому я построил графики остатков и пояснительную переменную:

plot(x = daily$Moon_Phase,
     y = E1,
     xlab = "Moon Phase",
     ylab = "Normalized residuals",
     xlim = c(0,nrow(daily))
)

Я также хочу проверить, нужно ли мне включать ежедневное $ name в качестве случайного эффекта, поэтому я сравнил остатки линейной модели без случайного эффекта с потенциальным случайным эффектом:

lm.test <- lm(count ~ Moon_Phase, data = daily)
lm.test.resid <- rstandard(lm.test)

и построил график:

plot(lm.test.resid ~ daily$name, 
     xlab = "Name",
     ylab = "Standardized residuals",
     xlim = c(0,nrow(daily))) 

Каждый раз, когда я использовал plot (), я получал следующее предупреждение:

Предупреждающее сообщение: В xy.coords (x, y, xlabel, ylabel, log): NA введено принуждением

Кто-нибудь знает, почему появляется это сообщение? Я видел здесь и на других форумах, что другие люди сталкивались с этой проблемой, и преобразование вещей в факторы и / или числа помогает другим людям, поэтому я попробовал as.numeric(E1), as.factor(daily$Moon_Phase) и as.factor(daily$name), но это, похоже, не помогло.

Спасибо!

...