В посттренировочном квантовании tflite (https://tensorflow.google.cn/lite/performance/post_training_quantization) мы можем использовать «Dynami c range квантование», которое статически квантовает только веса от плавающей запятой до 8-битной точности.
Но операторы "dynamici c -range" динамически квантуют активации на основе своего диапазона до 8 бит и выполняют вычисления с 8-битными весами и активациями.
Я хочу квантовать весовые коэффициенты до int8 и убедиться, что все операторы вычисляются с использованием ядер с плавающей запятой при выводе, что означает, что никакие активации не будут квантованы.
Итак, как я могу Осознать это? Как я могу избежать квантования этих "Dynami c -диапазонных" операторов?