Поскольку ваша цель - получить некоторую интуицию о том, что происходит, вот что вы можете сделать:
Давайте начнем со Random Forest для простоты, но вы можете сделать это и с другими алгоритмами.Во-первых, вам нужно построить хорошую модель.Это хорошо в том смысле, что вы должны быть удовлетворены его производительностью , и оно должно быть Надежным , что означает, что вы должны использовать проверочный набор и / или набор тестов.Эти моменты очень важны, потому что мы проанализируем, как модель принимает свои решения, поэтому, если модель плохая, вы получите плохую интуицию.
После построения модели вы можете проанализировать ее на двух уровнях:весь набор данных (понимание вашего процесса), или для данного прогноза.Для этой задачи я предлагаю вам взглянуть на библиотеку SHAP , которая вычисляет вклады объектов (т. Е. Насколько влияет объект на прогноз моего классификатора), которые можно использовать для обеих куколок.
Подробные инструкции по этому процессу и другим инструментам вы можете найти быстро. На отличных курсах серия машинного обучения , где уроки 2/3/4/5 посвящены этой теме.
Надеюсь, это поможет!