В настройках классификации по нескольким меткам или в настройках классификации по нескольким классам (даже если существуют разные настройки), существует два способа создания этих структур.
- Softmax и возвращает вероятностное распределение c по n, выбирают лучшие k меток для настроек мультиметок и softmax и производят метки самого высокого класса для настроек мультиклассов
- one-vs- все тренируют несколько классификаторов, устанавливая метки как один-против-всех
И люди обычно говорят, что настройка № 2 не учитывает зависимости меток. Почему это так?