Как бы я обозначил данные обучения и тестирования для сверточной нейронной сети? - PullRequest
0 голосов
/ 13 апреля 2019

Это немного абстрактный вопрос.

У меня есть группа изображений размером 28x28 пикселей от определенных людей, и я хотел бы пометить эти данные для каждого человека, который их написал.Как бы я обозначил это для обучения и тестирования?Это моя первая нейронная сеть, и мне трудно найти какие-либо учебные пособия, которые соответствуют моим конкретным потребностям.Такое ощущение, что большинство данных, таких как MNIST / EMNIST, уже помечены.

Еще немного информации о том, что я использую Python 3 и Keras с бэкэндом Tensorflow.

1 Ответ

0 голосов
/ 15 апреля 2019

Я предполагаю, что вы знаете, кто написал каждое изображение.Тогда нужно связать эту информацию (метку класса) с каждым изображением.Есть несколько способов сделать это.Два общих подхода:

Структура папки

Создайте папку для каждого класса (человека) и поместите изображения внутрь.

Содержимое папки:

john/01.png
john/02.png
jane/03.png
susan/...

CSV-файл

В этом случае все изображения могут быть в одной папке, а затем используется отдельный файл Comma-Separated-Values ​​для хранения

Содержимое папки:

dataset.csv
images/01.png
images/02.png
images/03.png
images/....

dataset.csv content:

filename,person
images/01.png,john
images/02.png,john
images/03.png,jane
...

Подход CSV хорош, если у вас есть дополнительные данные о каждом файле, который вы хотите сохранить.Например, метаданные, которые могут иметь отношение к делу, например, кто записал файл, когда он был записан, с каким типом оборудования, в каком месте и т. Д.

...