Параметр spatial window_size
определяет размер кадрирования, который вы хотите получить из входных изображений во время увеличения данных.
Что важно при установке этого параметра для изображения, для надписей и для вывода?
Этот параметр должен быть одинаковым в разделах [TRAINING]
и [INFERENCE]
, поскольку конвейер использует spatial_window_size
для объединения исправлений в исходное разрешение. Выбор начального размера окна зависит от совместимых форм для вашей архитектуры CNN, размерности вашей входной формы (2D-срезы против Voxels) и ваших ограничений памяти (слишком большой, и он может не помещаться в памяти вашего GPU).
Когда выбирать большие или меньшие пространственные формы:
Как правило, более крупные размеры патчей предпочтительнее (наблюдалось, что они дают немного лучшую производительность), и я бы сослался на этот ответ для обоснования. Однако это зависит от вашего конкретного набора данных, поэтому я бы порекомендовал вам поэкспериментировать с различными размерами патчей.
Однако вы также можете использовать технику под названием Создание размеров (см. Совет № 9), где вы начинаете тренировку с использованием меньшего spatial_window_size
, затем увеличиваете размер и тренируете ту же модель. снова, чтобы уменьшить переоснащение и улучшить общую производительность. Обратите внимание, что это будет работать, только если вы используете полностью сверточные CNN или CNN с некоторой формой пространственной пирамиды (где размер входного изображения не имеет значения).
Почему размеры этикетки и изображения отличаются?
Требуется больше разъяснений по этому вопросу (т.е. конфигурация, исходное разрешение изображения), но, к сожалению, у меня недостаточно репутации, чтобы комментировать.
Параметр border
в разделе [INFERENCE]
удаляет заполнение из параметра volume_padding_size
в разделе [TRAINING]
. В соответствии с документацией конфигурации граница должна быть не менее floor(N-D)/2
, где N
представляет один из элементов исходного размера вокселя / среза, а D
представляет один из элементов выведенной сети Размер вокселя / среза (spatial_window_size
). Для двумерных размеров окна (т.е. 96 X 96 X 1) border
может быть (96,96,0), где последний элемент должен быть 0. Следовательно, параметр border зависит от размера окна и не влияет на то, как мы его выбираем. Скорее, мы выбираем параметр границы в зависимости от того, насколько мы хотим, чтобы сеть фокусировалась на внешних пикселях над центральными пикселями.