Sklearn's TimeSeriesSplit - это полезный способ реализации временного ряда, эквивалентного перекрестной проверке kfold. Похоже, однако, что он имеет поддержку только для одношагового горизонта и не имеет многошаговых горизонтов, например он из набора данных [1, 2, 3, 4]
может использоваться для создания следующих наборов поездов и тестов соответственно
[1, 2], [3]
[1, 2, 3], [4]
[1, 2, 3, 4], [5].
То, что не могло быть произведено, - это что-то с горизонтом многоэтапного прогноза. Горизонт прогнозирования разделения многоступенчатых временных рядов будет выглядеть как
[1, 2,], [3, 4]
[1, 2, 3], [4, 5]
[1, 2, 3, 4], [5, 6],
например.
Я хотел бы знать, есть ли для этого веская причина? Я могу реализовать свою собственную версию TimeSeriesSplit, так что это не проблема, однако я новичок в области прогнозирования. Насколько я понимаю, использование такой процедуры является статистически лучшим способом измерения точности модели. Тогда мне кажется любопытным, что sklearn не предоставляет эту функциональность из коробки и хотел бы знать, есть ли причина, почему и если я упустил из виду какую-либо причину того, почему наличие многоэтапного горизонта прогноза, как показано выше, означает мой метод статистической точности оценки должны измениться?