Мультиколлинеарность означает, что две или более ваших переменных предиктора имеют тесную линейную связь друг с другом. Это может быть проблематично c в моделях обучения, так как вы в основном тренируетесь на двух версиях одной и той же переменной, которая может искажать результаты и гиперпараметры, если не обрабатываться правильно. Это особенно проблематично * с использованием моделей на основе регрессии c.
Примером может быть количество обзоров и количество загрузок для видеоигры. Возможно, мы пытаемся предсказать цену, и регрессия по количеству обзоров и загрузок будет несколько избыточной, поскольку, как правило, чем больше людей играет в игру, тем больше отзывов.