Квантильная регрессия с независимыми данными - PullRequest
0 голосов
/ 16 января 2019

У меня есть набор данных, который включает в себя несколько наблюдений для каждого человека и вида, но в некоторых случаях у меня нет индивидуальной идентичности. Я хочу использовать 90% квантильную регрессию, чтобы исследовать компромисс между двумя переменными (и найти теоретическую верхнюю границу или предел для этого компромисса), но я не хочу брать среднее для каждого вида (или отдельного человека), потому что я потеряю много потенциально интересной информации. Поэтому мой вопрос заключается в том, могу ли я использовать квантильную регрессию для независимых данных? Если так, то как? Любые ссылки на статьи или ссылки будут высоко оценены!

Я могу выполнить квантильную регрессию для своих данных, но я нарушаю предположения о независимости данных.

# load library    
        library(quantreg)

# sim random values
        x <- runif(50, 0 , 5 )
        x.2 <- runif(50, 0 , 10 )
        y <- runif(50 , 0 , 50)
        y.2 <- runif( 50 , 0 , 10 )

# combine into df
        sim.df <- cbind.data.frame(c(x,x.2),c(y,y.2))
        colnames(sim.df) <- c("x", "y")

# generate colors to show grouping (either by individual or species)
        rbPal <- colorRampPalette(c('red','blue', "green"))
        sim.df$colors <- rbPal(10)[as.numeric(cut(sim.df$x,breaks = 10))]

#plot
        plot(sim.df$x, sim.df$y, col=sim.df$colors, pch=19, 
        xlab="Independent Variable", ylab="Dependent Variable")


# 90% quantile regression line
        abline(rq(sim.df$y~ sim.df$x, tau = 0.90), col="black")

#  calculate p-value
        mod.sim <- rq(sim.df$y~ sim.df$x, tau = 0.90)
        summ <- summary(mod.sim,se="boot",R=10000)
        summ
...