У меня есть несколько вопросов об обучении нейронной сети с использованием обучения с подкреплением, например, DQN: 1. Должны ли мы использовать регуляризаторы или выбывшие при определении нашей модели?2. Что мы можем контролировать на этапе обучения?