Используя Python, я пытаюсь предсказать, имеет ли право человек на получение кредита или нет. Таким образом, мои выходные данные будут равны 1 или 0.
Я хочу использовать метод обучения подкреплению, чтобы учиться и экспериментировать. Но я не нашел никаких полезных ресурсов о том, как использовать RL в задачах классификации.
Мой вопрос заключается в том, подходит ли использование RL, или он слишком сложен для моей проблемы, и он не используется в подобных реальных проблемы мира?
Если ответ положительный, как я могу применить RL в задачах классификации?