stats ::: plot.lm используется для построения диагноза c графиков, и есть два варианта:
id.n: number of points to be labelled in each plot, starting with
the most extreme.
labels.id: vector of labels, from which the labels for extreme points
will be chosen. ‘NULL’ uses observation numbers.
По умолчанию id.n = 3, поэтому они всегда обозначают 3 наблюдения с наибольшей дистанцией повара. Я включил это как часть ответа, потому что вы можете быть осторожны, интерпретируя их как выбросы.
Чтобы получить эти баллы, вы должны
mod1 <- lm(Var1~Location,data)
outl = order(-cooks.distance(mod1))[1:3]
outl
[1] 18 6 16
Чтобы построить график, вы можете либо предоставьте label.id идентификатор, который вы хотите, или вы начинаете с нуля:
par(mfrow=c(1,2))
plot(mod1,which=1,labels.id =data$ID)
plot(fitted(mod1),residuals(mod1))
panel.smooth(fitted(mod1),residuals(mod1))
text(fitted(mod1)[outl]+0.01,residuals(mod1)[outl],
data$ID[outl],col="red")
До go через все графики, выполните :
plot(mod1,labels.id=data$ID)