Подгонка данных с блеском к смещенному гамма-распределению - PullRequest
2 голосов
/ 26 января 2020

Я анализирую продолжительность дискретных событий, которые были обнаружены в данных временных рядов, используя порог длительности 300 мс, то есть обнаруженные события могут быть только дольше, чем 300 мс. Когда я посмотрел на свои данные, я ожидал, что они будут следовать смещенному гамма-распределению. Это действительно, казалось, имело место; когда я подгоняю сдвинутые данные (продолжительность - 300 мс) к модели блеска с семейством гамма (лог), я получаю следующие результаты DHARMa:

DHARMa scaled residual plots

Несмотря на KS-тест указывая на иное, я думаю, что qqplot выглядит разумно, а график residuals-vs-предсказанных значений выглядит так, что в нем почти нет смещения и нелинейностей. Поэтому я решил продвинуться вперед и провести проверку гипотез между уровнями категориального фактора в модели, используя процедуру начальной загрузки параметрирования c. Поскольку этот фактор был значительным, я продолжил тесты после 10 * 10 с использованием пакета emmeans. Однако здесь я сталкиваюсь с проблемами, поскольку EMM основаны на модели, которая была адаптирована к смещенным данным: таким образом, оценка контрастности между уровнями категориального фактора теперь выражается в виде отношения (с использованием log-link), что, очевидно, неверно, поскольку Я вычел порог ранее.

Вот несколько вопросов, которые у меня есть:

  1. Считаете ли вы, что смещение данных на порог обнаружения до подбора является разумным подходом к подгонке этого данные?
  2. Есть ли другой дистрибутив, который я мог бы попробовать в рамках glmer? Я попытался преобразовать обычные логарифмические данные, но это значительно недооценивает средние значения по сравнению со смещенным гамма-распределением.
  3. Есть ли у вас какие-либо предложения относительно решения проблемы, с которой я сталкиваюсь во время пост-ho c тестирования?

Я надеюсь, что моя проблема и вопросы несколько ясны. Как бы вы обработали эти данные?

...