Я реализую программу для выборки целых чисел из категориального распределения, где каждое целое число связано с вероятностью.Мне нужно убедиться, что эта программа дифференцируема, чтобы можно было применить обратное распространение.Я обнаружил tf.contrib.distributions.RelaxedOneHotCategorical
, что очень близко к тому, чего я пытаюсь достичь.
Однако метод sample
этого класса возвращает однозначный вектор вместо целого числа.Как написать программу, которая является дифференцируемой и возвращает целое число / скаляр вместо вектора?