Я пытаюсь определить критическую область в ненормальном двумерном распределении.В частности, я пытаюсь найти область в определенном направлении (аналог одностороннего теста), то есть область, где обе переменные имеют необычно высокие значения.Я попытался вычислить расстояние Махаланобиса и t-квадрат Hotelling, чтобы найти крайние 5% площади, но не мог понять, как ограничить мою область только областью, где обе переменные высоки.
#data generation
library(fungible)
cormat <- matrix(c(1,.60,
.60,1),byrow = T, nrow=2, ncol=2)
dat <- monte1(seed = 123, nsub = 1000, nvar = 2, skewvec = c(.20,.10),
kurtvec = c(-.50,-.80), cormat = cormat)
library(scales)
scaled.v1 <- round(scales::rescale(dat$data[,1], to=c(0,50)),0)
scaled.v2 <- round(scales::rescale(dat$data[,2], to=c(0,25)),0)
data <- cbind(scaled.v1,scaled.v2)
#here is what I tried, which only give me the outliers in all directions
mah <- mahalanobis(data,colMeans(data), cov(data) )
t2 <- mah^2/2 #Hotellin`s t-squared
Любые идеи будут высоко оценены!