Я строю Agent
из keras-rl
и использую LinearAnnealedPolicy
с EpsGreedyQPolicy
. Подробный вывод выдает среднее значение эпсилона для каждого интервала, но позже я хочу построить график вознаграждения против эпсилона, и история поездов, возвращенная методом подбора, не имеет массива для эпсилонов. Есть ли способ Callback
для этого?