Я работаю с системой типа rcnn, где automated focal loss
была недавно реализована с https://arxiv.org/pdf/1904.09048.pdf
В приведенной выше статье в разделе 3.4. Regression
указано
Мы предполагаем, что метки распределены вокруг фактической правильной основной истины гауссовским распределением с дисперсией σ ^ 2.
и
Однако для правильного вычисления кумулятивной функции распределения необходимо оценить дисперсию σ ^ 2 задачи. [...] тренировка переменной σ ^ 2 как вес сети.
У меня нет данных для отклонения задачи σ^2
.
Я не совсем понимаю, как это можно узнать, не имея данных для этого.
Должен ли я просто сделать переменную trainable
и предположить, что оптимизатор знает, что делать?