Я работаю над алгоритмом Q-обучения, где мне нужно создать формулу для создания собственного цвета путем смешивания многих цветов.Таким образом, цель здесь состоит в том, чтобы сгенерировать формулу для всех допустимых пользовательских цветов
success forumla - заслуга с наградой
плохая формула - наказать агента с недостатками
По сути, яу меня есть 10 базовых цветов, из которых мне нужно создавать собственные цвета.Основные цвета: красный, зеленый, синий, белый, черный, желтый и т. Д.
Я кодирую эти основные цвета, используя горячее кодирование
red here is [1,0,0,0,0,0,0,0,0,0]
green here is [0,1,0,0,0,0,0,0,0,0]
blue here is [0,0,1,0,0,0,0,0,0,0]
white here is [0,0,0,1,0,0,0,0,0,0]
black here is [0,0,0,0,1,0,0,0,0,0]
yellow is [0,0,0,0,0,1,0,0,0,0]
etc,etc
, если я хочу сгенерировать
CASE 1: pink color then it is a mix of red + white ( GOOD FORMULA )
CASE 2: light green colour then it is a mix of green + white ( GOOD FORMULA )
CASE 3: grey colour then it is a mix of black + white ( GOOD FORMULA )
CASE 4: purple colour then it is a mix of pink + black ( GOOD FORMULA )
CASE 5: eggplant colour is purple + green ( GOOD FORMULA )
CASE 6: BAD colour is purple + black ( BAD FORMULA )
Полагаю, состояние является цветом, а действие выбирает другой цвет, в результате чего получается собственный цвет.
Если состояние является одним из базовых цветов, я могу представить состояние цветом (используя одно горячее кодирование).
Но если состояние является пользовательским цветом, есть ли способ представить это в числовом представлении?(для СЛУЧАЙ 4, СЛУЧАЙ 5 и СЛУЧАЙ 6)
Надеюсь, я разъяснил свой случай настолько, насколько это возможно.Поскольку существует 10 базовых цветов, комбинации являются массивными и, следовательно, состояниями.Не уверен, как действовать отсюда.Любое руководство будет иметь огромную помощь