Я пытаюсь решить проблему прогнозирования временных рядов для многомерных данных в Python, используя подход LSTM.
В здесь , автор, решающий проблему для прогнозирования загрязнения воздуха временных рядов.Данные выглядят следующим образом:
pollution dew temp press wnd_dir wnd_spd snow rain
date
2010-01-02 00:00:00 129.0 -16 -4.0 1020.0 SE 1.79 0 0
2010-01-02 01:00:00 148.0 -15 -4.0 1020.0 SE 2.68 0 0
2010-01-02 02:00:00 159.0 -11 -5.0 1021.0 SE 3.57 0 0
2010-01-02 03:00:00 181.0 -7 -5.0 1022.0 SE 5.36 1 0
2010-01-02 04:00:00 138.0 -7 -5.0 1022.0 SE 6.25 2 0
В отличие от ежегодного в этом уроке, у меня есть 30-секундные наблюдения за шагом по футбольным матчам с более чем 20 функциями.Где каждое совпадение с уникальным идентификатором имеет различную длину в диапазоне от 190 до 200.
Автор разделил поезд / тест, заданный по количеству дней в году следующим образом:
# split into train and test sets
values = reframed.values
n_train_hours = 365 * 24
train = values[:n_train_hours, :]
test = values[n_train_hours:, :]
Итак, мой поезд/ Тестовый набор должен соответствовать количеству совпадений: (соответствует * len (соответствует))
n_train_matches = some k number of matches * len(match)
train = values[:n_train_matches, :]
test = values[n_train_matches:, :]
Я хочу перевести это в мою задачу, чтобы сделать прогноз для каждой функции уже в момент времени t = 2.Т.е. 30 секунд до начала матча.
Вопрос
Нужно ли применять предварительное дополнение к каждому совпадению?
Есть ли способ решения проблемы без заполнения?