У меня есть куча данных временных рядов цены против дней. Я пытаюсь применить LSTM для прогнозирования, однако я не уверен, как лучше отформатировать пакеты для моих данных обучения. Вот два подхода, которые я рассматриваю с примером размера пакета 3 и размером набора данных 12:
Набор данных [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12]
Подход № 1:
Входные партии:
[1, 2, 3] [4, 5, 6] [7, 8, 9]
Пакеты вывода:
[4, 5, 6] [7, 8, 9] [10, 11, 12]
Подход № 2: Пакеты ввода :
[1, 2, 3] [2, 3, 4] [3, 4, 5] [4, 5, 6] [5, 6, 7] ..... [9, 10, 11]
Выходные партии:
[2, 3, 4] [3, 4, 5] [4, 5, 6] [5, 6, 7] [6, 7, 8] ..... [10, 11, 12]
В основном различия между этими двумя подходами заключаются в том, что в первом примере первые 3 точки данных предсказывают следующие 3 точки данных, тогда как во втором Например, первые 3 точки данных предсказывают только точки данных x + 1.
Итак, какой подход пакетирования будет наиболее подходящим для прогнозирования? Первый подход предпочтителен из-за того, что его вычислительно легче обучать, но я не уверен, является ли это логичным способом построения обучающих данных.
Спасибо за ваш вклад.