Я использую класс Spark mlib's
BinaryClassificationMetrics
для генерации метрик для вывода RandomForestClassificationModel
. Я просмотрел документы Spark и смог сгенерировать thresholds
, precisionByThreshold
, recallByThreshold
, roc
и pr
.
Я хотел знать, используется ли какое-либо конкретное пороговое значение при генерации roc
. Это потому, что в ROC wikipedia говорится, что:
Кривая ROC создается путем построения графика зависимости истинного положительного значения (TPR) от уровня ложного положительного результата (FPR) при различных настройках порога.
Мне было интересно, используется ли какое-либо оптимальное пороговое значение или нет при создании ROC в Spark. Если нет, то почему?