Как выбрать бета в F-бета - PullRequest
0 голосов
/ 22 октября 2018

Я использую поиск по сетке, чтобы оптимизировать гиперпараметры подгонки в случайный лес по сбалансированному набору данных, и я борюсь с тем, какую метрику оценки модели выбрать.Учитывая реальный контекст этой проблемы, ложные отрицания являются более дорогостоящими, чем ложные срабатывания.Сначала я пытался оптимизировать отзыв, но в итоге получал очень много ложных срабатываний.Мое решение состоит в том, чтобы вместо этого оптимизировать F-бета счет с бета> 1. Мой вопрос, как лучше выбрать бета?Если я могу рассчитать стоимость ложного отрицательного и ложного положительного результата, могу ли я установить бета = Стоимость ложного отрицательного / Стоимость ложного положительного?Имеет ли этот подход смысл?

1 Ответ

0 голосов
/ 16 мая 2019
  • Чтобы придать Precision больший вес, мы выбираем значение бета-версии в интервале 0
  • . Чтобы придать дополнительный вес значению Recall, мы выбираем значение бета-версии в интервале 1.

Когда вы установите beta = Стоимость ложного отрицания / Стоимость ложного положительного , тогда вы получите больший вес для отзыва, в случае, если стоимость ложного отрицания равнавыше, чем у ложного срабатывания, поэтому он будет работать, но это не значит, что это оптимальное решение для вашей проблемы.

Оптимизация бета-версии имеет отношение к форме ваших данных, поэтому было бы лучшепробовать разные значения Beta в ваших данных, пока не получите наилучшее значение.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...