Понимание формы ввода (пространственный_окно_размера) для Niftynet - PullRequest
0 голосов
/ 29 августа 2018

Я использую Niftynet для сегментации медицинских изображений. Я видел отличный учебник по ограничениям параметров пространственного_окна_схемы здесь https://nbviewer.jupyter.org/gist/fepegar/1fb865494cb44ac043c3189ec415d411.

Но мне интересно, как выбрать между возможными формами? Какая логика стоит за ними? Когда выбрать больший или меньший размер пространственной_оконной формы? Что важно при установке этого параметра для изображения, для надписей и для вывода? Почему размеры этикетки и изображения разные? Меня также интересует, как параметр border влияет на этот выбор.

1 Ответ

0 голосов
/ 01 сентября 2018

Параметр spatial window_size определяет размер кадрирования, который вы хотите получить из входных изображений во время увеличения данных.

Что важно при установке этого параметра для изображения, для надписей и для вывода?

Этот параметр должен быть одинаковым в разделах [TRAINING] и [INFERENCE], поскольку конвейер использует spatial_window_size для объединения исправлений в исходное разрешение. Выбор начального размера окна зависит от совместимых форм для вашей архитектуры CNN, размерности вашей входной формы (2D-срезы против Voxels) и ваших ограничений памяти (слишком большой, и он может не помещаться в памяти вашего GPU).

Когда выбирать большие или меньшие пространственные формы:

Как правило, более крупные размеры патчей предпочтительнее (наблюдалось, что они дают немного лучшую производительность), и я бы сослался на этот ответ для обоснования. Однако это зависит от вашего конкретного набора данных, поэтому я бы порекомендовал вам поэкспериментировать с различными размерами патчей.

Однако вы также можете использовать технику под названием Создание размеров (см. Совет № 9), где вы начинаете тренировку с использованием меньшего spatial_window_size, затем увеличиваете размер и тренируете ту же модель. снова, чтобы уменьшить переоснащение и улучшить общую производительность. Обратите внимание, что это будет работать, только если вы используете полностью сверточные CNN или CNN с некоторой формой пространственной пирамиды (где размер входного изображения не имеет значения).

Почему размеры этикетки и изображения отличаются?

Требуется больше разъяснений по этому вопросу (т.е. конфигурация, исходное разрешение изображения), но, к сожалению, у меня недостаточно репутации, чтобы комментировать.

Параметр border в разделе [INFERENCE] удаляет заполнение из параметра volume_padding_size в разделе [TRAINING]. В соответствии с документацией конфигурации граница должна быть не менее floor(N-D)/2, где N представляет один из элементов исходного размера вокселя / среза, а D представляет один из элементов выведенной сети Размер вокселя / среза (spatial_window_size). Для двумерных размеров окна (т.е. 96 X 96 X 1) border может быть (96,96,0), где последний элемент должен быть 0. Следовательно, параметр border зависит от размера окна и не влияет на то, как мы его выбираем. Скорее, мы выбираем параметр границы в зависимости от того, насколько мы хотим, чтобы сеть фокусировалась на внешних пикселях над центральными пикселями.

...