Я пытаюсь выполнить квантование замороженных графиков (.pb) в pytorch, цель состоит в том, чтобы получить меньший файл .pb. В тензорном потоке для этого преобразования есть bazel-bin / tenorflow / tools / quantification / quantize_graph. Какой эквивалент у pytorch?
Я знаю о QNNPACK, но не могу найти учебник по этому поводу.
Спасибо!