ARIMA Прогнозирование - PullRequest
0 голосов
/ 07 июня 2018

У меня есть данные временного ряда, которые выглядят примерно так:
Loan_id Loan_amount Loan_drawn_date
id_001 2000000 2015-7-15
id_003 100 2014-7-8
id_009 78650 2012-12-23
id_990 100 2018-11-12

Я пытаюсь построить модель прогнозирования Arima на этих данных, котораяимеет около 550 наблюдений.Вот шаги, которые я выполнил

Преобразовал данные временного ряда в ежедневные данные и заменил значения NA на 0. Данные выглядят примерно так

Loan_id Loan_amount Loan_drawn_date

id_001 2000000 2015-7-15
id_001 0 2015-7-16
id_001 0 2015-7-17
id_001 0 2015-7-18
id_001 0 2015-7-19
id_001 0 2015-7-20
....
id_003 100 2014-7-8
id_003 0 2014-7-9
id_003 0 2014-7-10
id_003 0 2014-7-11
id_003 0 2014-7-12
id_003 0 2014-7-13
....
id_009 78650 2012-12-23
id_009 0 2012-12-24
id_009 0 2012-12-25
id_009 0 2012-12-26
id_009 0 2012-12-27
id_009 0 2012-12-28
...
id_990 100 2018-11-12
id_990 0 2018-11-13
id_990 0 2018-11-14
id_990 0 2018-11-15
id_990 0 2018-11-16
id_990 0 2018-11-17
id_990 0 2018-11-18
id_990 0 2018-11-19

Может кто-нибудь, пожалуйста, суБоже, как мне теперь перейти к этим 0 значениям?

Видя отклонения в количестве суммы кредита, я бы взял журнал суммы кредита.Я пытаюсь построить модель ARIMA впервые, и я прочитал обо всех методах вменения, но я ничего не могу найти.Может кто-нибудь, пожалуйста, скажите мне, как мне поступить вперед в этих данных

1 Ответ

0 голосов
/ 09 июня 2018

Я не знаю точно о вашей конкретной проблеме домена, но обычно это применимо в общем случае:

  1. Если значения NA представляют 0 значений для проблемы вашего домена, заменитеони с 0, а затем соответствуют модели ARIMA (это будет, например, случай, если вы смотрите на ежедневные продажи, а в некоторые дни у вас 0 продаж)

  2. Если значения NA представляютнеизвестные значения для вашей конкретной проблемы домена, затем не заменяйте их и не подходите для вашей модели ARIMA.(это было бы так, если бы в определенный день сотрудник забыл записать объем продаж, и это может быть любое число).

Вероятно, я бы вообще не использовал вменение.Существуют методы для подгонки модели ARIMA к временным рядам, в которых отсутствуют значения.Обычно эти алгоритмы, вероятно, также должны быть реализованы где-то в Python.(но я не знаю, так как я в основном использую R)

...