Я смотрел учебник по UCB в Udemy и не увидел смысла в использовании этого алгоритма.
Например, у вас 10 рекламных роликов, и вы знаете поведение 10000 пользователей (щелкнуть или нет). Вы используете UCB, чтобы узнать лучшую рекламу из этих 10. Но вы также можете подсчитать все клики и получить тот же результат.
Пример данных
Результат UCB (4-е объявление - лучшее) - результат учителя
Результат сумма кликов ( 4-е объявление - лучшее)
Как видите, разницы нет. Результат тот же, 4-е объявление - лучшее.
Может учитель привел плохой пример? А есть ли смысл в использовании UCB? Или я не совсем понял.
Вы можете мне с этим помочь? Спасибо)