Усиление обучения непрерывным действиям границ - PullRequest
0 голосов
/ 22 сентября 2018

Это код, который я обычно вижу mu, sigma = mu * A_BOUND [1], sigma + 1e-4.Но что, если моя граница будет [-240,240].Сигма не будет достаточно, чтобы действительно исследовать.Что делать в этом случае, я тоже умножу сигму?

...