У меня есть набор данных, который включает в себя несколько наблюдений для каждого человека и вида, но в некоторых случаях у меня нет индивидуальной идентичности. Я хочу использовать 90% квантильную регрессию, чтобы исследовать компромисс между двумя переменными (и найти теоретическую верхнюю границу или предел для этого компромисса), но я не хочу брать среднее для каждого вида (или отдельного человека), потому что я потеряю много потенциально интересной информации. Поэтому мой вопрос заключается в том, могу ли я использовать квантильную регрессию для независимых данных? Если так, то как? Любые ссылки на статьи или ссылки будут высоко оценены!
Я могу выполнить квантильную регрессию для своих данных, но я нарушаю предположения о независимости данных.
# load library
library(quantreg)
# sim random values
x <- runif(50, 0 , 5 )
x.2 <- runif(50, 0 , 10 )
y <- runif(50 , 0 , 50)
y.2 <- runif( 50 , 0 , 10 )
# combine into df
sim.df <- cbind.data.frame(c(x,x.2),c(y,y.2))
colnames(sim.df) <- c("x", "y")
# generate colors to show grouping (either by individual or species)
rbPal <- colorRampPalette(c('red','blue', "green"))
sim.df$colors <- rbPal(10)[as.numeric(cut(sim.df$x,breaks = 10))]
#plot
plot(sim.df$x, sim.df$y, col=sim.df$colors, pch=19,
xlab="Independent Variable", ylab="Dependent Variable")
# 90% quantile regression line
abline(rq(sim.df$y~ sim.df$x, tau = 0.90), col="black")
# calculate p-value
mod.sim <- rq(sim.df$y~ sim.df$x, tau = 0.90)
summ <- summary(mod.sim,se="boot",R=10000)
summ