Нормализованная взаимная информация (NMI) и B3 используются для extrinsi c метрики оценки кластеризации, когда каждый экземпляр (образец) имеет только одну метку.
Каковы эквивалентные метрики, когда каждый экземпляр (образец) имеет только одна метка?
Например, на первом изображении мы видим [яблоко, апельсин, груши], на втором изображении мы видим [апельсин, лайм, лимон] и на третьем изображении мы видим [яблоко], и на четвертом изображении мы видим [оранжевый]. Затем, если поместить первое изображение и последнее изображение в один кластер, это хорошо, а если поместить третье и четвертое изображение в один кластер, это плохо.
Применение: Многие популярные наборы данных для обнаружения объектов или сегментации изображений имеют несколько меток для каждого изображения. Если мы использовали эти данные для классификации (не для обнаружения и не для сегментации), у нас есть несколько меток для каждого изображения.
Примечание. Моя задача - кластеризация без контроля, а не классификация под наблюдением. Я знаю, что для контролируемой классификации мы можем использовать рейтинг 5 или 10. Но я не знаю, что будет при неконтролируемой кластеризации.