Я попробовал эти два метода с pycaffe:
loss_weigth=100
в prototxt; net.blobs['fc'].diff[...] = A_loss + 100*B_loss
.
Я думал, что они делаютТо же самое в теории BP, потеря модели показывает противоположные результаты.
Я хочу знать, в чем разница между этими двумя методами?Как я должен иметь дело с весами потерь, если есть многократные потери?