Как получить параметры softmax в TensorFlow, если softmax не включен в тренировку? - PullRequest
0 голосов
/ 05 октября 2018

Вот график тензорного потока , так как мы можем видеть, что одним из входов кросс-энтропии является выход логит-слоя, а не вывод softmax на графике.

Я искал об этом и обнаружил, что «ПРЕДУПРЕЖДЕНИЕ: этот оператор ожидает немасштабированные логиты, поскольку он выполняет softmax для логитов внутри системы для эффективности. Не вызывайте эту операцию с выводом softmax, так как он даст неверные результаты».на этой веб-странице .

Мой вопрос: как получить параметры softmax, если этот softmax не обучен?

1 Ответ

0 голосов
/ 05 октября 2018

enter image description here

Softmax - это функция активации без параметров, такая как RELU, Tanh или Sigmoid: ее не нужно обучать.Он только вычисляет экспоненту каждого логита, а затем нормализует выходной вектор на сумму экспонент.

...