Инициализируйте двумерный массив равномерно в numpy - PullRequest
0 голосов
/ 28 февраля 2020

Я хочу создать стохастику распределения вероятностей c для обучения с подкреплением .

e.i policy[s,a] = P(take action a | in state s), where n_states=500 and n_actions=6

Поскольку мы все еще используем целочисленные представления состояний и действий, мне нужно использовать 2 массив для представления политики.

Как я могу инициализировать мою политику равномерно ? то есть вероятности всех действий должны быть равны.

1 Ответ

0 голосов
/ 29 февраля 2020

policy = np.full(fill_value = 1. / n_actions, shape = (n_states, n_actions)) @ Jdehesa

...