Эффективный вывод трехмерной модели глубокого обучения (pytorch) - PullRequest
1 голос
/ 02 марта 2020

Я пытаюсь использовать Pytorch 3D UNet для вывода (отсюда: https://github.com/wolny/pytorch-3dunet), который получает изображения размером (96, 96, 96). Я хотел бы использовать его на экземплярах процессора, но я получаю очень много использования памяти (~ 18 ГБ). Изучив эту тему, я обнаружил, что это связано с тем, как на CPU реализованы свертки (см. https://discuss.pytorch.org/t/pytorch-high-memory-demand/2798/5). Таким образом, у меня возникают следующие вопросы:

  1. Есть ли способ использовать более эффективную реализацию памяти в свертке в Pytorch?
  2. Как я могу оптимизировать свою модель для вывода процессора? Я видел, что некоторые инструменты, такие как AWS Neo, Intel OpenVINO и др. c. существовать; Могут ли они решить мою проблему?
  3. Есть ли у Tensorflow аналогичная проблема при использовании сверток на процессоре?
  4. Любой другой совет, ссылка на способ эффективного развертывания таких моделей приветствуется!

Спасибо!

...