На самом деле в документации TorchVision есть много деталей.
Типичное использование cas - для задач обнаружения объектов или сегментации изображений, но могут быть и другие варианты использования.
Вот неполный список of use:
- Resize используется в сверточных нейронных сетях для адаптации входного изображения к форме входного сигнала сети, в данном случае это не увеличение данных, а просто предварительная обработка. Он также может использоваться в полностью сверточных сетях для эмуляции различных масштабов для входного изображения, это увеличение данных.
- CenterCrop RandomCrop и RandomResizedCrop используются в задачах сегментации, чтобы обучить сеть на мелких деталях, не мешая при этом слишком много нагрузка во время тренировки. Для базы данных с размером 2048x2048 изображений вы можете тренироваться на 512x512 подизображениях, а затем во время теста выводить изображения с полным разрешением. Он также используется в сетях обнаружения объектов в качестве дополнения данных. Вариант с измененным размером позволяет объединить предыдущую операцию изменения размера.
Все они потенциально могут изменить разрешение изображения.