Я не понимаю, почему инверсия быстрее для выборки.
Как я понимаю, для вычисления логарифма и сдвига мы все еще go через атуорегрессивные слои, но мы меняем порядок наших нормализующих потоков. Поэтому выборка будет такой же, как и при обучении.