Использование оценок с tf xla.compile - PullRequest
1 голос
/ 15 мая 2019

Я использую некоторые консервативные оценки, предоставляемые тензорным потоком, такие как DNN. Результирующий размер модели довольно большой (несколько сотен мегабайт), а также задержки довольно высоки (сотни миллисекунд). Я хочу попробовать компиляцию AOT, чтобы увидеть, получу ли я улучшения задержки обслуживания и уменьшения размера модели. Есть ли пример того, как я могу получить xla.compile, работающий с консервированной оценкой. Можете ли вы указать мне какой-нибудь пример кода или любой другой, имеющий подобный опыт, направит меня в правильном направлении?

...