Как я могу разделить мой набор данных на основе меток в другом массиве? - PullRequest
0 голосов
/ 09 марта 2020

Я пытаюсь разделить свой набор данных для обучения нейронной сети

Учитывая 2 массива (dataset и Labels)

dataset - это трехмерный массив с формой (128,6, -1), тогда как labels - это массив 1d, содержащий соответствующие метки dataset

Ex данных в метках [0,0,0,0,1,1,1,1,2,2,2,2,2,2,2,2,2,2]

Я хочу разделить данные основаны на метках с коэффициентом 0,7-0,3 для моего поезда и набора проверки.

Я не хочу перетасовывать данные и хочу получить следующий результат trainLabels = [0,0,0,1,1,1,2,2,2,2,2,2,2] с соответствующими им данными обучения в том же индексе и evalLabel = [0,,1,2,2,2] также с соответствующими данными обучения в том же индексе.

Существует ли функция из pandas, numpy или scikit learn, которая позволяет мне это делать?

Я пытался sklearn.model_selection.train_test_split, но набор данных перемешивается

(Дополнительный вопрос не требуется, чтобы ответить: могу ли я просто перемешать свой набор данных и разделить их? Есть ли отрицательные эффекты?)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...