Имеется массив данных, состоящий из данных, которые были сгенерированы за время симуляции. Исходя из этого, я использую тензорный поток и керас для обучения нейронной сети, и мой вопрос касается этой строки кода в моей модели:
model.fit(X1, Y1, epochs=1000, batch_size=100, verbose=1, shuffle=True, validation_split=0.2)
Прочитав в документации Keras, я обнаружил, что набор проверочных данных (в данном случае 20% исходных данных) разрезан с конца. Поскольку я генерирую данные за текущее время, я, очевидно, не хочу, чтобы последняя часть была обрезана, потому что она не будет репрезентативной для проверки. Я бы предпочел, чтобы данные проверки выбирались случайным образом из всего набора данных. Для этой цели я сейчас перетасовываю свой весь набор данных (входы и выходы для ANN в унисон) перед тренировкой, чтобы получить случайные данные проверки.
Мне кажется, что я не хочу портить компонент времени в моих данных, поэтому я ищу решение, чтобы просто выбрать набор проверки случайным образом без необходимости перетасовывать весь набор данных. Кроме того, я хотел бы знать, что вы, ребята, думаете о том, чтобы не тасовать непрерывные данные. Опять же, я не спрашиваю о характере разделения проверки, я просто хочу знать, как изменить способ выбора данных проверки.