Кривые точности / отзыва - оптимальная кривая и порог - PullRequest
0 голосов
/ 28 февраля 2019

Я хочу использовать кривые Precision-Recall, чтобы определить, какой порог и какая кривая лучше всего подходит для моего набора данных.(У меня есть большое количество истинных негативов - порядка 400 000+)

У меня есть предопределенные пороги: 1+, 2+, 3+, 4+, 5+, 10+ и предопределенные кривые: A, B, C. Я уже рассчитал значения для точности / повторного вызова для каждого порога для каждой кривой и могу отобразить это в Excel:

enter image description here

Вопрос (ы)

Как мне взять мои известные значения для Precision / Recall и вычислить AUC для каждой кривой?Это лучший или единственный способ выбрать лучшую кривую?Визуально кажется, что красная кривая «C» была бы лучшей - но я ищу более математический / статистический способ определения этого.

Вы находите оптимальный порог для любой данной кривой, вычисляя длинукасательной к точке (1,1) правильно?Оптимальным порогом для этой кривой является тот, который имеет самую короткую касательную линию?

Спасибо, ахн

...