Что такое b, y, x и c, которые сглаживаются и возвращаются вместе с функциями с максимальным пулом в tf.nn.max_pool_with_argmax? - PullRequest
0 голосов
/ 24 декабря 2018

Я просмотрел документацию tf.nn.max_pool_with_argmax , где написано

Выполняет максимальное объединение на входе и выводит как максимальные значения, так и индексы.

Индексы в argmax сглаживаются, так что максимальное значение в позиции [b, y, x, c] становится сглаженным индексом ((b * высота + y) * ширина + x) * channel + c.

Возвращаемые индексы всегда находятся в [0, высота) x [0, ширина) перед выравниванием, даже если задействовано заполнение и математически правильный ответ находится снаружи (либо отрицательный, либо слишком большой).Это ошибка, но исправить ее трудно безопасным образом, обратно совместимым способом, особенно из-за выравнивания.

Переменные b, y, x и c не были явно определены, поэтому ябыли проблемы с реализацией этого метода.Может ли кто-нибудь, пожалуйста, предоставить то же самое.

1 Ответ

0 голосов
/ 24 декабря 2018

Я не могу комментировать из-за репутации.

Но я думаю, что переменные ссылаются на позицию и размер окна Max Pooling.x и y - это координаты x и y ядра, когда оно движется вдоль входной матрицы, а b и c - ширина и высота ядра.Вы бы установили b и c в размере ядра.

Если у вас возникла проблема с реализацией max pooling с argmax, это не имеет ничего общего с этими переменными.Возможно, вы захотите указать проблему, которую вы имеете с Max Pooling

...