Для оценки модели прогнозирования на день вперед.Для моего теста на разделение поезда я делаю 80:20 или делаю (остаток дня: последний день)? - PullRequest
0 голосов
/ 02 февраля 2019

У меня есть данные временных рядов за 3 месяца с 15-минутными интервалами.(один день имеет 96 временных интервалов) У меня есть столбец температуры [Temp] и столбец солнечной освещенности [SI] (интенсивность солнца).Моя модель должна прогнозировать температуру на день вперед на весь день.т.е. я должен предсказать 96 временных интервалов с учетом данных за предыдущий день.Когда я оцениваю свою модель «самостоятельно» и делю свои данные на наборы поездов и тестов.Как мне их разделить?Я делаю 80:20 сплит?но мои данные теста будут иметь более одного дня чтения.Или я делаю (3 месяца - 1 день) -> как поезд и тестирую только в последний день?

1 Ответ

0 голосов
/ 02 февраля 2019

На самом деле, это зависит от вашей задачи.Но настоятельно рекомендуется не смешивать старые / новые данные в наборе поездов.

Существует несколько ссылок, которые могут оказаться полезными:

http://francescopochetti.com/pythonic-cross-validation-time-series-pandas-scikit-learn/

https://stats.stackexchange.com/questions/117350/how-to-split-dataset-for-time-series-prediction

https://stats.stackexchange.com/questions/346907/splitting-time-series-data-into-train-test-validation-sets

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...