Лмер, занимающий слишком много времени, чтобы запустить большой набор данных - PullRequest
0 голосов
/ 25 июня 2018

У меня огромный массив данных (31584 строки), который состоит из данных об урожайности, собранных по нескольким округам и годам.

Каждый район вложен в штат, а каждый штат - в ACZ или климатическую зону.

Я хочу построить смешанную модель, используя урожай в качестве отклика и 11 климатических переменных (одна из которых - индекс засухи)

У меня также есть другая группирующая переменная, которая классифицирует уровень орошения как низкий,средний или высокий.

Я определил свою модель следующим образом:

mod <- lmer(crop.yield ~ # 11 climate variables + year + (1|ACZ) + (1|state) + (1 + year|district) +  (1 + drought|irrigation), REML = FALSE, data = dat)

Если я правильно понимаю, я указываю, что тренд года меняется от района к району.В то же время влияние засухи также меняется в зависимости от уровня орошения.Я надеюсь, что мое понимание верно.

Мне нужно несколько советов о том, как сделать мой lme4 быстрее.Когда я запускаю указанную выше команду, она запускается слишком долго.Прошел час, и команда все еще работает.Мне нужно предложение о том, как сделать это быстрее?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...