Я пытаюсь квантовать график тензопотока, хранящийся в .pb.Вводом сети является матрица, в которой каждая строка нормализована со средним значением 0 и стандартным значением 1. Я хочу создать модель с тензорным потоком, облегчающую квантование для взаимодействия быстрее.Я не знаю, как передать входные данные для преобразования строки.Это всего лишь одно значение?вектор с 64 значениями?как это передается?
Модель хорошо конвертируется без квантования.
tflite_convert \
--output_file=model_simple_weight_q.tflite \
--graph_def_file=model_simple.pb \
--inference_type=QUANTIZED_UINT8 \
--input_arrays=input \
--output_arrays=LogSoftmax \
--mean_values= # dont know \
--std_dev_values=# dont know
Если я передам два отдельных значения, --mean_values = 127 и --std_dev_values = 128, например.Просто чтобы узнать, что происходит, я получаю следующую ошибку:
F tensorflow/lite/toco/graph_transformations/resolve_constant_gather.cc:108] Check failed: coords_array.data_type == ArrayDataType::kInt32 Only int32 indices are supported
Aborted (core dumped)