В чем разница между комбинацией «Многорукий бандит» (CMAB) и «попытка и статистика»?
Насколько я понимаю, я думал, что стратегия CMAB такая же, чтобы выделить часть сетитрафик, чтобы использовать различные варианты, затем статистика и исправить исходное распределение ...
Может кто-нибудь сказать мне разницу?