Я думаю, что сеть должна обрабатывать пары изображений обложка / стегано
вместе, чтобы узнать, какие обложки и какие стеганографические
изображений. Я прав?
Я не знаком с обнаружением объектов (верно?) В Nvidia Digits, поэтому, пожалуйста, ознакомьтесь с их учебными пособиями для получения дополнительной информации.
Вы должны сначала подумать о том, как пометить тренировочные данные. Обычно в примерах, которые я вижу, используется только одна обучающая папка и одна папка проверки (каждая: изображения и метки) - цифры разделяют ваш набор данных, например, в 90% обучения и 10% проверки изображений.
Как работает размер партии? Если я даю 1, это берет одно изображение от обоих
подкаталоги и обрабатывать их? или я должен ввести номер партии
как 2 за что?
С номером партии вы указываете цифры, сколько изображений вы используете за итерацию. Он используется для разделения набора данных (память для вычислений ограничена; вы не можете уместить весь набор данных в одну итерацию). В одну эпоху обрабатывается весь набор данных.
Как написано выше, по одному изображению за раз, насколько я знаю.
Как работает перетасовка данных в каждую эпоху? это тасует оба суб
каталоги одинаково? в качестве примера будет 1.jpg третье фото на
обе папки или они будут разными на обеих?
Данные должны быть перетасованы автоматически .