Я видел во многих местах, что для классификации нескольких меток с использованием нейронных сетей одной полезной функцией потерь является двоичная кросс-энтропия для каждого из выходных узлов.
В Tensorflow это выглядит так:
cost = tf.nn.sigmoid_cross_entropy_with_logits()
Это дает массив с таким количеством значений, сколько у нас есть выходных узлов.
Мой вопрос , если эта функция стоимости будет усреднена по числувыходные узлы?Что в Tensorflow будет выглядеть так:
cost = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits())
Или каждая потеря обрабатывается независимо?
Спасибо