Как представлять состояния в числовом представлении для обучения подкреплению.(Создать Q-таблицу) - PullRequest
0 голосов
/ 03 января 2019

Я работаю над алгоритмом Q-обучения, где мне нужно создать формулу для создания собственного цвета путем смешивания многих цветов.Таким образом, цель здесь состоит в том, чтобы сгенерировать формулу для всех допустимых пользовательских цветов

success forumla - заслуга с наградой

плохая формула - наказать агента с недостатками

По сути, яу меня есть 10 базовых цветов, из которых мне нужно создавать собственные цвета.Основные цвета: красный, зеленый, синий, белый, черный, желтый и т. Д.

Я кодирую эти основные цвета, используя горячее кодирование

red   here is [1,0,0,0,0,0,0,0,0,0]
green here is [0,1,0,0,0,0,0,0,0,0]
blue  here is [0,0,1,0,0,0,0,0,0,0]
white here is [0,0,0,1,0,0,0,0,0,0]
black here is [0,0,0,0,1,0,0,0,0,0]
yellow     is [0,0,0,0,0,1,0,0,0,0]
etc,etc

, если я хочу сгенерировать

CASE 1: pink color then it is a mix of red + white  ( GOOD FORMULA )
CASE 2: light green colour then it is a mix of green + white  ( GOOD FORMULA )
CASE 3: grey colour then it is a mix of black + white   ( GOOD FORMULA )
CASE 4: purple colour then it is a mix of pink + black  ( GOOD FORMULA )
CASE 5: eggplant colour is purple + green  ( GOOD FORMULA )
CASE 6: BAD colour is purple + black  ( BAD FORMULA )

Полагаю, состояние является цветом, а действие выбирает другой цвет, в результате чего получается собственный цвет.

Если состояние является одним из базовых цветов, я могу представить состояние цветом (используя одно горячее кодирование).

Но если состояние является пользовательским цветом, есть ли способ представить это в числовом представлении?(для СЛУЧАЙ 4, СЛУЧАЙ 5 и СЛУЧАЙ 6)

Надеюсь, я разъяснил свой случай настолько, насколько это возможно.Поскольку существует 10 базовых цветов, комбинации являются массивными и, следовательно, состояниями.Не уверен, как действовать отсюда.Любое руководство будет иметь огромную помощь

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...