Глубокое обучение - это метод, использующий нейронные сети для создания аппроксиматоров функций для решения различных задач.Пример: изучение функции, которая принимает изображение в качестве входных данных и выводит ограничивающие рамки объектов на изображении.
Обучение усилению - это поле, в котором у нас есть агент, и мы хотим, чтобы этот агентвыполнить задачу, то есть задачи, основанные на цели, где мы используем методы проб и ошибок обучения.Пример: агент учится переходить из одной позиции в мире сетки в целевую позицию, не попадая в лужу между ними.
Обучение с глубоким подкреплением - это способ решения задач на основе целей с использованием нейронныхсетей.Это потому, что когда мы хотим, чтобы агенты выполняли задачи в реальном мире или в текущих играх, пространство состояний очень велико.Агенту требуется очень много времени, чтобы хотя бы раз посетить каждое состояние, и мы не можем использовать справочные таблицы для хранения функций-значений.Итак, для решения этой проблемы мы используем нейронные сети для аппроксимации состояния для обобщения процесса обучения. Пример: Мы используем DQN для решения многих игр atari.
Q-learning : Это временноеметод разностного обучения, где у нас есть Q-таблица для поиска наилучшего возможного действия в текущем состоянии на основе функции Q-значения.Для изучения значений Q мы используем вознаграждение и максимально возможное значение Q следующего состояния.
Q-обучение в основном относится к обучению с подкреплением, и его аналогом глубокого обучения является сеть Deep Q.