Проблемы с диагностикой пророческого прогноза - PullRequest
0 голосов
/ 21 февраля 2019

Я работаю с набором данных о преступлениях в Чикаго и специально работаю над будущим прогнозом уровня преступности в Чикаго (с 2012 по 2016 год у меня есть данные).Я сгенерировал прогноз, используя пакет пророка в Facebook.Это сработало очень хорошо и все сделано.Теперь я хотел бы потренироваться и протестировать свою модель.Таким образом, я разбил набор данных на 70% поезд и 30% тест.Я обучил модель и протестировал ее, и в конце я получил хороший сюжет.Я также заинтересован в диагностической части.Пророк предусматривает для этого функцию с именем cross_validation(), которую я использовал: df.cv<- cross_validation(m, initial = nrow(trainData), period = 365, horizon = nrow(testData), units = 'days').Проблема здесь, я всегда получаю эту ошибку и пытаюсь со вчерашнего дня исправить ее, но безуспешно:

Fehler in generate_cutoffs(df, horizon.dt, initial.dt, period.dt) : 
Less data than horizon after initial window. Make horizon or initial shorter.

Кто-нибудь знает, как исправить эту ошибку и предоставить список диагностики?

Мой поезд / тестовый участок выглядит так:

Train/Test Plot

И мой набор данных поезда можно скачать здесь: https://ufile.io/4e38c И мой тестовый набор данныхздесь: https://ufile.io/ds65p

Надеюсь, кто-нибудь сможет мне помочь!Это было бы здорово, и я был бы очень признателен.Заранее спасибо!

1 Ответ

0 голосов
/ 08 мая 2019

Перекрестная проверка будет применена к скользящему окну, выполняя отсечки на основе настроек.Пожалуйста, прочитайте документы здесь: https://facebook.github.io/prophet/docs/diagnostics.html

Ошибка, которую вы получаете, потому что ваше скользящее окно выходит за пределы.Попробуйте вот так:

df.cv<- cross_validation(m, initial = 100, period = 100, horizon = 100, units = 'days') 
...