У меня есть многомерный набор данных (3500,10), в котором есть одна двоичная переменная, которую я хочу предсказать, y (3500, 1).Поэтому я использовал следующий код для разделения X и y и создания структуры данных с 60 временными шагами для использования в качестве входных данных для сети LSTM:
data_set = data_set.as_matrix() # Using multiple predictors.
X_total = []
y_total = []
n_future = 1 # Number of days you want to predict into the future
n_past = 60 # Number of past days you want to use to predict the future
for i in range(60, len(data_set)):
X_total.append(data_set[i-n_past:i, :9])
y_total.append(data_set[i+n_future-1:i + n_future, 9])
X_total, y_total = np.array(X_total), np.array(y_total)
Затем я получаю X_total (3460,60,9) и y_total(3460,1)
Как я могу быть уверен, что NN использует для каждого obs X_total совпадающий y_total?Это немного сбивает с толку, когда я смотрю на данные X_total, кажется, что они начинаются с первых obs исходного data_set, а y_total - с 60-го.Как я могу это проверить?