Я пытаюсь использовать Pytorch 3D UNet для вывода (отсюда: https://github.com/wolny/pytorch-3dunet), который получает изображения размером (96, 96, 96). Я хотел бы использовать его на экземплярах процессора, но я получаю очень много использования памяти (~ 18 ГБ). Изучив эту тему, я обнаружил, что это связано с тем, как на CPU реализованы свертки (см. https://discuss.pytorch.org/t/pytorch-high-memory-demand/2798/5). Таким образом, у меня возникают следующие вопросы:
- Есть ли способ использовать более эффективную реализацию памяти в свертке в Pytorch?
- Как я могу оптимизировать свою модель для вывода процессора? Я видел, что некоторые инструменты, такие как AWS Neo, Intel OpenVINO и др. c. существовать; Могут ли они решить мою проблему?
- Есть ли у Tensorflow аналогичная проблема при использовании сверток на процессоре?
- Любой другой совет, ссылка на способ эффективного развертывания таких моделей приветствуется!
Спасибо!