Мы выбираем максимум окна, чтобы взять пиксель, который наиболее активирован (больше активации пикселя означает больше информации).
Существуют варианты, такие как avg-pooling, чтобы взять среднее значение всех пикселей окна, но на практике разница в результатах невелика.
Max-Pooling эффективен и быстр.Другая причина использования max-pool над avg-pool заключается в том, что вычисление градиента (в backprop) будет быстрым для max-pooling.