решаемая. Я не знал, что нейронная сеть фактически выводит Q-значения для каждого состояния, помещает их в один массив и возвращает. Таким образом, в основном, у меня есть Q-значение каждого состояния, даже если я использую мини-пакеты состояний в качестве входных данных NN.