Я тренирую UNET для семантической сегментации, но у меня есть только 200 помеченных изображений.Учитывая небольшой размер набора данных, он определенно нуждается в некоторых методах дополнения данных.
У меня есть вопрос по поводу теста и набора проверки.
У меня есть пользовательский генератор данных, который продолжает подавать данные из папкидля модели обучения.
Итак, что я планирую сделать:
выполнить увеличение данных для обучающего набора и сохранить все это в одной папке
«случайным образом» выбрать некоторые тренировочные данные в набор для проверки и проверки (конечно, перед тренировкой).
Я не уверен, что это нормально,поскольку мы просто выполняем простую обработку (перелистывание, транспонирование, регулировка яркости)
Было бы лучше сначала разделить данные и выполнить увеличение для остальных данных в папке обучения?