Пространственная инвариантность по U- Net с объединением и повышением частоты - PullRequest
0 голосов
/ 18 января 2020

Давайте возьмем пример U- Net со стандартной архитектурой (см. Ниже), в которой размер входа и выхода одинаков (например, 256x256 пикселей). Здесь у нас есть сеть, применяющая определенное количество операций объединения и повышения частоты дискретизации после нескольких конв. слои в частях кодирования и декодирования. Зная, что обе операции вызывают пространственную инвариантность, я ожидаю, что попиксельная информация об объекте (которая будет сегментирована на выходе), включая его положение на исходном входном изображении, будет потеряна по всей U- Net. То же самое применимо, если мы посмотрим назад от последнего слоя, где объект сегментирован; было бы невозможно переместить этот сегментированный объект на предыдущие слои в части декодирования.

Мой вопрос: поскольку мы выполняем свертку, перемещая фильтр по входу, возможно ли сохранить пространственные свойства, например, положение объекта на разных слоях, если мы применим пул с ядром размером 2x2 и шагом 2x2 и повышающую дискретизацию размера 2x2? Я ожидаю, что так будет, например, для 256x256 пикселей ввода / вывода, без дополнительного дополнения во время свертки.

Под пространственными свойствами я подразумеваю положение объекта, но также его пространственную протяженность с учетом разрешение карт объектов: сегментированный объект, имеющий 50x50 пикселей на выходной карте сети (256x256 пикселей), будет иметь размер 25x25 пикселей в предыдущем слое (128x128 пикселей), и центру положения соответствующего пикселя (x, y) потребуется только разделить на 2, чтобы получить объект на предыдущем слое.

A U-Net with input and output of same size to segment objects.

...