Question

Я развернул модель глубокого обучения и сохранил модель keras как файл .h5 . Я думаю, что сложная модель сделает его большим по размеру и, следовательно, замедлит взаимодействие на сервере, но есть ли способ, кроме сокращения уровней в модели, которые я могу сделать? Существует ли способ сжатия файла .h5 для его быстрой загрузки на сервер?

Спасибо

Timbus Calin · Answer 1 · 06 января 2020

Есть способ сделать это.

То, что вы ищете, называется quantization.

Не обязательно сокращать слои, что эквивалентно сокращению модели, quantization уменьшает как размер, так и задержку модели, изменяя точность весов (или даже активацию в некоторых случаях).

Для получения более подробной информации читайте эту страницу в официальной документации TensorFlow: https://www.tensorflow.org/lite/performance/post_training_quantization

производство - Какой лучший способ загрузить файл для быстрого вычисления?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

производство - Какой лучший способ загрузить файл для быстрого вычисления?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов