Я пытаюсь разделить свой набор данных для обучения нейронной сети
Учитывая 2 массива (dataset
и Labels
)
dataset
- это трехмерный массив с формой (128,6, -1), тогда как labels
- это массив 1d, содержащий соответствующие метки dataset
Ex данных в метках [0,0,0,0,1,1,1,1,2,2,2,2,2,2,2,2,2,2]
Я хочу разделить данные основаны на метках с коэффициентом 0,7-0,3 для моего поезда и набора проверки.
Я не хочу перетасовывать данные и хочу получить следующий результат trainLabels = [0,0,0,1,1,1,2,2,2,2,2,2,2]
с соответствующими им данными обучения в том же индексе и evalLabel = [0,,1,2,2,2]
также с соответствующими данными обучения в том же индексе.
Существует ли функция из pandas, numpy или scikit learn, которая позволяет мне это делать?
Я пытался sklearn.model_selection.train_test_split
, но набор данных перемешивается
(Дополнительный вопрос не требуется, чтобы ответить: могу ли я просто перемешать свой набор данных и разделить их? Есть ли отрицательные эффекты?)