- Я работаю над проектом с RL & NN
- Мне нужно определить структуру вектора действия, которая будет поступать в нейронную сеть.
У меня есть 3 различных действия (A & B и Nothing), каждое из которых имеет разные полномочия (например, A100 A50 B100 B50)
Интересно, как лучше всего передать эти действия NN, чтобы получить лучшие результаты?
1 - подача A / B на вход 1, в то время как сила действия 100/50 / Ничего на ввод 2
2- подача A100 / A50 / ничего для ввода 1, а B100 / B50 / ничего для ввода 2
3 - подача A100 / A50 на вход 1, в то время как B100 / B50 на вход 2, а Nothing помечает для ввода 3
4- Также кормить 100 и 50 или нормализовать их до 2 & 1?
Мне нужны причины, чтобы выбрать один метод
Любые предложения рекомендуются
Спасибо