Я хочу использовать кривые Precision-Recall, чтобы определить, какой порог и какая кривая лучше всего подходит для моего набора данных.(У меня есть большое количество истинных негативов - порядка 400 000+)
У меня есть предопределенные пороги: 1+, 2+, 3+, 4+, 5+, 10+ и предопределенные кривые: A, B, C. Я уже рассчитал значения для точности / повторного вызова для каждого порога для каждой кривой и могу отобразить это в Excel:
Вопрос (ы)
Как мне взять мои известные значения для Precision / Recall и вычислить AUC для каждой кривой?Это лучший или единственный способ выбрать лучшую кривую?Визуально кажется, что красная кривая «C» была бы лучшей - но я ищу более математический / статистический способ определения этого.
Вы находите оптимальный порог для любой данной кривой, вычисляя длинукасательной к точке (1,1) правильно?Оптимальным порогом для этой кривой является тот, который имеет самую короткую касательную линию?
Спасибо, ахн