Функция потери нескольких меток для большого набора данных - PullRequest
0 голосов
/ 16 января 2020

Я тренирую CNN для мульти-меток, но у него около 160 меток, поэтому при использовании обычной архитектуры CNN с сигмоидом для выходного слоя и binary_crossentropy для потери сеть по-прежнему смещена для нулей, потому что функция потерь берет все выходы и нормализует их, поэтому наименьшая потеря произойдет, когда все выходные данные будут иметь нули, даже правильные метки, потому что они нормализованы. так у кого-нибудь есть решение?

1 Ответ

0 голосов
/ 02 апреля 2020

Используйте категориальную кросс-энтропию вместо бинарной кросс-энтропии и используйте softmax вместо сигмовидной.

...