Усиление обучения подкрепляется методом проб и ошибок.Результаты, которые являются неправильными (или менее чем оптимальными), не должны корректироваться вручную.Вместо этого основное внимание уделяется исследованию, и обратная связь (подкрепление) получается из этого же опыта.