Пожалуйста, обратитесь к следующей статье:
https://towardsdatascience.com/multi-label-image-classification-with-inception-net-cbb2ee538e30
Техника, использованная в этой статье, выглядит примерно так:
ground_truth = np.zeros(class_count, dtype=np.float32)
ground_truth[label_index] = 1.0
Это может плохо масштабироватьсядля очень большого количества классов (10 тысяч).Чтобы увеличить количество классов, вам потребуется эквивалент tf.nn.sparse_softmax_cross_entropy_with_logits
для сигмоида, которого, похоже, не существует.