Question

Я пытаюсь разделить свой набор данных для обучения нейронной сети

Учитывая 2 массива (dataset и Labels)

dataset - это трехмерный массив с формой (128,6, -1), тогда как labels - это массив 1d, содержащий соответствующие метки dataset

Ex данных в метках [0,0,0,0,1,1,1,1,2,2,2,2,2,2,2,2,2,2]

Я хочу разделить данные основаны на метках с коэффициентом 0,7-0,3 для моего поезда и набора проверки.

Я не хочу перетасовывать данные и хочу получить следующий результат trainLabels = [0,0,0,1,1,1,2,2,2,2,2,2,2] с соответствующими им данными обучения в том же индексе и evalLabel = [0,,1,2,2,2] также с соответствующими данными обучения в том же индексе.

Существует ли функция из pandas, numpy или scikit learn, которая позволяет мне это делать?

Я пытался sklearn.model_selection.train_test_split, но набор данных перемешивается

(Дополнительный вопрос не требуется, чтобы ответить: могу ли я просто перемешать свой набор данных и разделить их? Есть ли отрицательные эффекты?)

Как я могу разделить мой набор данных на основе меток в другом массиве?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Как я могу разделить мой набор данных на основе меток в другом массиве?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Нет похожих вопросов