рассмотрим свертку с входной формой L * L * 10. Возьмите размер Kernal = K и размер фильтра = F, тогда форма ядра (K, K, 10, F). Теперь вместо инициализации всех весов в ядре мы можем инициализировать только верхнюю половину три angular части ядра в измерениях 0 и 1, а затем сформировать все ядро для использования в слое свертки.
Здесь я хочу использовать только (K * (K + 1) / 2) * 10 * F количество обучаемых параметров вместо K * K * 10 * F, чтобы уменьшить количество параметров и также использовать симметрию помогает в обучении сети.