Является ли оценка F1 хорошим показателем для сбалансированного набора данных? - PullRequest
1 голос
/ 21 января 2020

Мой набор данных приблизительно сбалансирован: 52/48. Я оцениваю как A CC, так и F1. Результат, возвращаемый моделью случайного леса, ниже

A cc: 52%

F1: 68%

Матрица путаницы:

     |Predicted
Label|0 |1
0    |52|122109
1    |19|134802

Я знаю, если я поменяю метки 0 на 1 и наоборот, оценка Ф1 будет очень маленькой. Так, в случае использования F1, я должен всегда переключать метки?

1 Ответ

0 голосов
/ 21 января 2020

Интерпретация балла F1 полностью зависит от произвольного выбора меток (это скрыто в его формулировке). Таким образом, оценка F1 является наиболее подходящей для случаев, когда метки классов фактически означают и соответствуют отрицательным и положительным в реальной жизни (например, наличие рака) и когда существует несбалансированное распределение классов (особенно, когда отрицательные значения значительно превосходят положительные). Поскольку ваши данные сбалансированы и кажется, что вы можете произвольно переключать метки, оценка F1 может не подходить для использования в качестве показателя c.

Это также может помочь: 1 2 3

...