В обучении с подкреплением, у агента и среды разные состояния или только одно? - PullRequest
0 голосов
/ 17 февраля 2020

Состояние окружающей среды или агента? Где-то, где я читаю среду, тоже есть состояние. Чем они оба отличаются?

1 Ответ

1 голос
/ 17 февраля 2020

Состояние представляет среду, видимую из агента.

Если вы хотите сказать, что какой-то атрибут является частью агента (скажем, у вас есть автомобиль, и вы заявляете, что его скорость принадлежит агенту ), то состояние содержит этот атрибут, но оно является частью среды, поскольку ваш агент существует в среде.

Затем, когда у вас есть несколько агентов, все они могут «визуализировать» среду через состояние, но каждый из них может быть разным.

Например,

Если у вас есть несколько ботов, играющих в карты, каждый бот будет представлять среду как видимые карты и карты в его руках. Следовательно, все ваши агенты (боты) будут по-разному воспринимать окружение, в результате чего разные государства будут их представлять. В этом случае вы можете сказать «состояние агента», это просто вопрос формулировки.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...