Мне сложно понять, как измерить точность и вспомнить мультиклассовую кластеризацию. Вот пример с 9 элементами:
с учетом следующей основной истины:
A,B,C,D
E,F,G
H,I
и следующая наблюдаемая кластеризация:
A,B,C
D
E,F,G,H,I
как рассчитать количество истинных положительных результатов (TP), ложных срабатываний (FP) и ложных отрицательных значений (FN)?
Мой наивный подход состоял в том, чтобы рассмотреть все пары элементов:
TP = 7 (A-B, A-C, B-C, E-F, E-G, F-G, H-I)
FP = 6 (E-H, E-I, F-H, F-I, G-H, G-I)
FN = 3 (A-D, B-D, C-D)
Это правильный способ сделать это?
Спасибо