Показать значение Q в Q обучения - PullRequest
0 голосов
/ 24 марта 2020

Я новичок в Q-learning, я хочу реализовать Gridwolrd с таблицей 3 * 5. Я могу найти конечные состояния, такие как этот код:

{(0, 1): {«вниз»: 0,22, «вправо»: 0,436, «вверх»: 0,19, «влево»: 0,123}, ( 1, 2): {«вниз»: 0,12, «вправо»: 0,656, «вверх»: 0,049, «влево»: 0,042}, (0, 0): {«вниз»: 0,149, «вправо»: 0,24, «вверх»: 0,058, «влево»: 0,162}, (2, 2): {«вниз»: 0, «вправо»: 0,698, «вверх»: 0, «влево»: 0,014}, (1, 1) : {«вниз»: 0,056, «вправо»: 0,413, «вверх»: 0,038, «влево»: 0,001}, (1, 4): {«вниз»: 0,153, «вправо»: 0,233, «вверх»: 0,517, «влево»: 0,252}, (0, 2): {«вниз»: 0,25, «вправо»: 0,567, «вверх»: 0,275, «влево»: 0,241}, (2, 0): {«вниз» «: 0,001,« вправо »: 0,114,« вверх »: 0,011,« влево »: 0}, (1, 3): {« вниз »: 0,385,« вправо »: 0,386,« вверх »: 0,833,« влево » ': 0,254}, (2, 3): {«вниз»: 1, «вправо»: 1, «вверх»: 1, «влево»: 1}, (2, 1): {«вниз»: 0, 'right': 0.355, 'up': 0, 'left': 0.013}, (0, 4): {'down': 0.068, 'right': 0.144, 'up': 0.398, 'left': 0.0} , (2, 4): {«вниз»: 0,13, «вправо»: 0,5, «вверх»: 0,287, «влево»: 0,898}, (0, 3): {«вниз»: 0,297, «вправо»: 0,253, «вверх»: 0,659, «влево»: 0,283}, (1,0): {«вниз»: 0,03, 'right': 0.179, 'up': 0.018, 'left': 0}} Но я хочу показать результаты в виде таблицы, как показано на следующем рисунке , введите описание изображения здесь . Кто-нибудь может мне помочь? Огромное спасибо.

...