Как разделить набор данных указанным c способом? - PullRequest
0 голосов
/ 05 января 2020

Я строю классификатор CNN для распознавания лиц, используя набор данных лиц Olivetti. Этот набор данных содержит 40 человек, и каждый человек имеет 10 фотографий. Мне нужно разделить набор данных таким образом, чтобы для тренировочного набора мне пришлось использовать 8 изображений каждого человека из 10, а для тестирования оставались два изображения человека. Как я могу разделить набор данных таким образом?

Сейчас у меня есть этот пример разделения данных на 40% тестирования, что не правильно.

 data = fetch_olivetti_faces()
 x_train, x_test, y_train, y_test = train_test_split(data.images, data.target, test_size=0.4, random_state=42)
...