В статье «Изучение весов и связей для эффективных нейронных сетей» он сокращает размер нейронных сетей в соответствии с критериями.Тем не менее, я обнаружил, что все реализации этой статьи физически не уменьшают размер модели.Они просто обнуляют вес некоторых нейронов, чтобы получить тот же результат.Но физически размер модели и время вывода не меняются.Мне интересно, как я мог физически это сделать?