Использование tflite_convert
требует определения --saved_model_dir
или --keras_model_file
. При использовании TF2.x вы должны использовать --enable_v1_converter
, если вы хотите преобразовать в квантованный tflite из замороженного графа.
EDIT:
То, что вы сейчас делаете, называется «фиктивным квантованием», который может использоваться для проверки времени вывода квантованной сети. Чтобы правильно квантовать сеть, информация о минимуме / максимуме слоев должна быть введена в нее с помощью поддельных узлов количественного анализа.
Пожалуйста, см. эту суть , например, коды о том, как это сделать. Эта запись в блоге также содержит некоторую информацию об обучении с учетом квантования.