Как отключить вычисления смешанной точности в выводе модели tflite? - PullRequest
0 голосов
/ 21 апреля 2020

В посттренировочном квантовании tflite (https://tensorflow.google.cn/lite/performance/post_training_quantization) мы можем использовать «Dynami c range квантование», которое статически квантовает только веса от плавающей запятой до 8-битной точности.

Но операторы "dynamici c -range" динамически квантуют активации на основе своего диапазона до 8 бит и выполняют вычисления с 8-битными весами и активациями.

Я хочу квантовать весовые коэффициенты до int8 и убедиться, что все операторы вычисляются с использованием ядер с плавающей запятой при выводе, что означает, что никакие активации не будут квантованы.

Итак, как я могу Осознать это? Как я могу избежать квантования этих "Dynami c -диапазонных" операторов?

...