производство - Какой лучший способ загрузить файл для быстрого вычисления? - PullRequest
0 голосов
/ 06 января 2020

Я развернул модель глубокого обучения и сохранил модель keras как файл .h5 . Я думаю, что сложная модель сделает его большим по размеру и, следовательно, замедлит взаимодействие на сервере, но есть ли способ, кроме сокращения уровней в модели, которые я могу сделать? Существует ли способ сжатия файла .h5 для его быстрой загрузки на сервер?

Спасибо

1 Ответ

1 голос
/ 06 января 2020

Есть способ сделать это.

То, что вы ищете, называется quantization.

Не обязательно сокращать слои, что эквивалентно сокращению модели, quantization уменьшает как размер, так и задержку модели, изменяя точность весов (или даже активацию в некоторых случаях).

Для получения более подробной информации читайте эту страницу в официальной документации TensorFlow: https://www.tensorflow.org/lite/performance/post_training_quantization

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...