Разделение поезда / тестового набора для LSTM с многомерным временным рядом - PullRequest
0 голосов
/ 18 декабря 2018

Я пытаюсь решить проблему прогнозирования временных рядов для многомерных данных в Python, используя подход LSTM.

В здесь , автор, решающий проблему для прогнозирования загрязнения воздуха временных рядов.Данные выглядят следующим образом:

                    pollution  dew  temp   press wnd_dir  wnd_spd  snow  rain
date
2010-01-02 00:00:00      129.0  -16  -4.0  1020.0      SE     1.79     0     0
2010-01-02 01:00:00      148.0  -15  -4.0  1020.0      SE     2.68     0     0
2010-01-02 02:00:00      159.0  -11  -5.0  1021.0      SE     3.57     0     0
2010-01-02 03:00:00      181.0   -7  -5.0  1022.0      SE     5.36     1     0
2010-01-02 04:00:00      138.0   -7  -5.0  1022.0      SE     6.25     2     0 

В отличие от ежегодного в этом уроке, у меня есть 30-секундные наблюдения за шагом по футбольным матчам с более чем 20 функциями.Где каждое совпадение с уникальным идентификатором имеет различную длину в диапазоне от 190 до 200.

Автор разделил поезд / тест, заданный по количеству дней в году следующим образом:

# split into train and test sets
values = reframed.values
n_train_hours = 365 * 24
train = values[:n_train_hours, :]
test = values[n_train_hours:, :]

Итак, мой поезд/ Тестовый набор должен соответствовать количеству совпадений: (соответствует * len (соответствует))

n_train_matches = some k number of matches * len(match)
train = values[:n_train_matches, :]
test = values[n_train_matches:, :]

Я хочу перевести это в мою задачу, чтобы сделать прогноз для каждой функции уже в момент времени t = 2.Т.е. 30 секунд до начала матча.

Вопрос

Нужно ли применять предварительное дополнение к каждому совпадению?

Есть ли способ решения проблемы без заполнения?

1 Ответ

0 голосов
/ 19 декабря 2018

Если вы используете LSTM, то я полагаю, что вы с большей вероятностью выиграете от этой модели, если будете дополнять и кормить в нескольких 30-секундных пошаговых наблюдениях.

Если вы не дополняли последовательности, ивы хотели получить прогноз при t = 2, тогда вы сможете использовать только самый последний шаг наблюдения.

...