Согласно Гипотезе о лотерейных билетах , существует два типа стратегий обрезки: обрезка одним выстрелом и итеративная обрезка. Оба объяснены на странице 2. Найти инициализацию для однократного сокращения легко, потому что мы обучаем сеть для j
итераций и затем возвращаем веса к инициализации, используя полученную маску. Что я не понимаю, так это итеративное сокращение. На странице 2 написано:
мы сосредоточены на итеративном сокращении, которое многократно обучает, сокращает и сбрасывает сеть за n циклов;
Что означает resets the network over n rounds
? Означает ли это, что в каждом раунде сокращения мы сбрасываем веса сети на инициализацию, используя полученную маску для текущего уровня сокращения? Или это означает, что мы обучаем и сокращаем сеть итеративно, не возвращаясь к инициализации, затем после n
уровней сокращения мы сбросим инициализацию, используя последнюю имеющуюся у нас маску?