правильно запаздывает с нерегулярно разнесенными данными - PullRequest
1 голос
/ 24 сентября 2010

У меня есть нерегулярно расположенные данные, например, таблица А. Частота - каждые 2-5 дней. У меня есть другой набор данных, таблица B, в которой есть записи для каждого дня недели. Я хочу запустить следующую регрессию:

A_ {t} = альфа + бета1 * B_ {t-2 месяца} + ошибка

где, когда я отстаю от B, если нет чего-то, что не совсем 60 дней назад, например если 60 дней назад было воскресенье, то просто выберите следующий понедельник. Я, конечно, могу построить этот цикл w / a, но каков путь R. В настоящее время данные хранятся в таблицах MySQL, и я использую RMySQL для доступа.

Спасибо за помощь.

1 Ответ

3 голосов
/ 24 сентября 2010

Вам нужен пакет zoo и его документация, в которой есть множество примеров того, как объединять, выравнивать, преобразовывать, ... данные по измерению времени.

Этосложная проблема.Вам придется подумать о том, как вы это делаете - но, по крайней мере, существуют подходящие и мощные инструменты.Есть также множество примеров использования здесь и в списках R.

Как минимум, вы можете использовать na.locf(), чтобы перенести ваше последнее нерегулярное наблюдение на следующее регулярное (после объединения данных на основеежедневные даты).Затем вы можете использовать lag() операторы на обычных данных.Кроме того, пакеты dynlm и dyn облегчают моделирование с помощью lm() для данных, помогая в zoo объектах, добавляя лаги и т. Д. В интерфейс формулы.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...