Как узнать скрытую переменную модели (дисперсию задачи) в тензорном потоке, которая не имеет наземных истинных данных - PullRequest
2 голосов
/ 08 июля 2019

Я работаю с системой типа rcnn, где automated focal loss была недавно реализована с https://arxiv.org/pdf/1904.09048.pdf

В приведенной выше статье в разделе 3.4. Regression указано

Мы предполагаем, что метки распределены вокруг фактической правильной основной истины гауссовским распределением с дисперсией σ ^ 2.

и

Однако для правильного вычисления кумулятивной функции распределения необходимо оценить дисперсию σ ^ 2 задачи. [...] тренировка переменной σ ^ 2 как вес сети.

У меня нет данных для отклонения задачи σ^2.

Я не совсем понимаю, как это можно узнать, не имея данных для этого.

Должен ли я просто сделать переменную trainable и предположить, что оптимизатор знает, что делать?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...