Байесовская гамма-регрессия, какова правильная функция связи? - PullRequest
0 голосов
/ 13 декабря 2018

Я пытаюсь сделать байесовскую гамма-регрессию со станом.Я знаю, что правильной функцией ссылки является обратная каноническая ссылка, но если я не использую лог-ссылку, параметры могут быть отрицательными и входить в гамма-распределение с отрицательным значением, что, очевидно, невозможно.как я могу справиться с этим?

parameters {
vector[K] betas; //the regression parameters
real beta0;
real<lower=0.001, upper=100 > shape; //the variance parameter
}
transformed parameters {
vector<lower=0>[N] eta; //the expected values (linear predictor)
vector[N] alpha; //shape parameter for the gamma distribution
vector[N] beta; //rate parameter for the gamma distribution

eta <- beta0 + X*betas; //using the log link 
}
model {  
beta0 ~ normal( 0 , 2^2 ); 

for(i in 2:K)
betas[i] ~ normal( 0 , 2^2 ); 

y ~ gamma(shape,shape * eta);
}

1 Ответ

0 голосов
/ 13 декабря 2018

Я боролся с этим пару недель назад, и хотя я не считаю это окончательным ответом, надеюсь, он все еще полезен.Что бы ни стоило, Маккалла и Нелдер прямо признают эту неуместную поддержку функции канонического соединения.Они советуют ограничить beta s, чтобы правильно соответствовать поддержке.Вот соответствующий отрывок

Функция канонического связывания дает достаточную статистику, которая является линейной функцией данных, и задается η = 1/μ.В отличие от канонических связей для пуассоновского и биномиального распределений, обратное преобразование, которое часто интерпретируется как скорость процесса, не отображает диапазон μ на всю действительную линию.Таким образом, требование, что η > 0 подразумевает ограничения β в любой линейной модели.При вычислении β_hat должны быть приняты соответствующие меры предосторожности, чтобы избежать отрицательных значений μ_hat.

- McCullagh and Nelder (1989). Обобщенные линейные модели. стр.291

Это зависит от ваших X значений, но, насколько я могу судить (пожалуйста, поправьте меня!) В байесовском случае на основе MCMC, вы можете добиться этого любымиспользование усеченного априора на beta с или достаточно сильного априора для вашего перехвата, чтобы сделать невозможным численный доступ к неподходящим регионам.

В моем случае я в конечном итоге использовал идентификационную ссылку с сильным положительным априорным перехватоми этого было достаточно, и это дало разумные результаты.

Кроме того, выбор ссылки действительно зависит от вашего X.Как следует из приведенного выше отрывка, использование канонической связи предполагает, что ваша линейная модель находится в пространстве скоростей.Использование функций регистрации или идентификации ссылок также очень распространено, и в конечном итоге речь идет о предоставлении пространства, обеспечивающего достаточный интервал для линейной функции для захвата ответа.

...