Здесь - пример фиктивной модели квантования модели keras. Обратите внимание, что я использую строгий tf1.15 для примера, потому что tf2.0 устарел:
converter.inference_input_type = tf.uint8
converter.inference_output_type = tf.uint8
с API from_keras_model
. Я думаю, что самое запутанное в этом то, что вы все еще можете назвать это, но ничего не происходит. Это означает, что модель все еще будет принимать входные данные с плавающей точкой. Я заметил, что вы используете tf2.0, потому что from_keras_model
это API-интерфейс tf2.0. Коралл все еще предлагает , используя tf1.15 для конвертации модели. Я предлагаю понизить тензор потока или, может быть, даже просто использовать это (при сохранении tf2.0, оно может работать или не работать):
tf.compat.v1.lite.TFLiteConverter.from_keras_model_file
Подробнее об этом здесь .