Я смотрел учебник по UCB в Udemy и не увидел смысла в использовании этого алгоритма.
Например, у вас 10 рекламных роликов, и вы знаете поведение 10000 пользователей (щелкнуть или нет). Вы используете UCB, чтобы узнать лучшую рекламу из этих 10. Но вы также можете подсчитать все клики и получить тот же результат.
Пример данных ![enter image description here](https://i.stack.imgur.com/hZLd5.png)
Результат UCB (4-е объявление - лучшее) - результат учителя
![enter image description here](https://i.stack.imgur.com/BKG5F.png)
Результат сумма кликов ( 4-е объявление - лучшее) ![enter image description here](https://i.stack.imgur.com/VWug7.png)
Как видите, разницы нет. Результат тот же, 4-е объявление - лучшее.
Может учитель привел плохой пример? А есть ли смысл в использовании UCB? Или я не совсем понял.
Вы можете мне с этим помочь? Спасибо)