Я работаю над преобразованием глубокой модели с плавающей запятой в модель int8 с помощью TensorRT. Вместо создания файла кеша с помощью TensorRT я хотел бы создать свой собственный файл кеша для использования TensorRT для калибровки. Однако кодовая база с открытым исходным кодом для TensorRT не дает подробных сведений о формате файла кэша калибровки. Кто-нибудь может подсказать? Спасибо!
На самом деле есть вопрос, похожий на этот, но не совсем такой. Кроме того, единственный ответ там не решает мою проблему. Итак, я спрашиваю здесь еще раз.