Глубокое обучение - разделение набора данных изображений на обучающие и тестируемые - PullRequest
0 голосов
/ 19 февраля 2019

введите описание изображения здесь У меня есть 3000 изображений для обучения и тестирования в одной папке, а также у меня есть метка изображения в файле label.csv, который имеет пять категорий классов.Может ли кто-нибудь помочь мне, как разбить этот набор данных на обучающие и тестовые данные, чтобы я мог классифицировать изображения с помощью сверточной нейронной сети.Мой набор данных выглядит как следующее изображение после связывания с CSV и изображениями.

1 Ответ

0 голосов
/ 26 февраля 2019

Во-первых, вам нужна связь между изображениями и метками (какое-то знание того, какая метка принадлежит какому изображению).В противном случае это не будет работать должным образом.После этого вы можете разделить ваш набор данных.Вот игрушечный пример, предполагая, что full_dataset содержит весь набор данных, а SIZE_OF_DATASET имеет размер full_dataset:

full_dataset = full_dataset.shuffle()
train_dataset = full_dataset.take(int(0.8*SIZE_OF_DATASET))
test_dataset = full_dataset.skip(int(0.2*SIZE_OF_DATASET))
...