Вы должны использовать softmax
, потому что это дает вам вероятности для каждого класса, независимо от того, сколько их там.Сигмоид, как вы написали, используется с binnary_crossentropy
и используется в бинарной классификации (отсюда и бинарная в названии).Надеюсь, теперь стало понятнее.