Алгоритм Sense of Upper Confidence Bound - PullRequest
0 голосов
/ 08 мая 2020

Я смотрел учебник по UCB в Udemy и не увидел смысла в использовании этого алгоритма.

Например, у вас 10 рекламных роликов, и вы знаете поведение 10000 пользователей (щелкнуть или нет). Вы используете UCB, чтобы узнать лучшую рекламу из этих 10. Но вы также можете подсчитать все клики и получить тот же результат.

Пример данных enter image description here

Результат UCB (4-е объявление - лучшее) - результат учителя

enter image description here

Результат сумма кликов ( 4-е объявление - лучшее) enter image description here


Как видите, разницы нет. Результат тот же, 4-е объявление - лучшее.

Может учитель привел плохой пример? А есть ли смысл в использовании UCB? Или я не совсем понял.

Вы можете мне с этим помочь? Спасибо)

1 Ответ

1 голос
/ 08 мая 2020

Я нашел ваш пример на этом сайте , возможно, он дает вам другой способ увидеть его. Из прочитанного и того, что я понимаю, алгоритм уверенности верхней границы будет в значительной степени способствовать четвертому объявлению. Возможно, здесь работает только гистограмма, но вы можете предвидеть случай, когда седьмое объявление находится настолько близко, что оно также может быть оптимальным для показа, но вам потребуется еще больше данных, чтобы убедиться, что вы делаете правильный запрос *. 1003 *

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...