Каков наиболее разумный способ генерирования данных обучения для серии временных рядов для нейронных сетей tenorflow LSTM? - PullRequest
0 голосов
/ 20 января 2020

У меня есть куча данных временных рядов цены против дней. Я пытаюсь применить LSTM для прогнозирования, однако я не уверен, как лучше отформатировать пакеты для моих данных обучения. Вот два подхода, которые я рассматриваю с примером размера пакета 3 и размером набора данных 12:

Набор данных [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12]

Подход № 1:

Входные партии:

[1, 2, 3] [4, 5, 6] [7, 8, 9]

Пакеты вывода:

[4, 5, 6] [7, 8, 9] [10, 11, 12]

Подход № 2: Пакеты ввода :

[1, 2, 3] [2, 3, 4] [3, 4, 5] [4, 5, 6] [5, 6, 7] ..... [9, 10, 11]

Выходные партии:

[2, 3, 4] [3, 4, 5] [4, 5, 6] [5, 6, 7] [6, 7, 8] ..... [10, 11, 12]

В основном различия между этими двумя подходами заключаются в том, что в первом примере первые 3 точки данных предсказывают следующие 3 точки данных, тогда как во втором Например, первые 3 точки данных предсказывают только точки данных x + 1.

Итак, какой подход пакетирования будет наиболее подходящим для прогнозирования? Первый подход предпочтителен из-за того, что его вычислительно легче обучать, но я не уверен, является ли это логичным способом построения обучающих данных.

Спасибо за ваш вклад.

...