Почему «модель с одной переменной» превосходит многомерную модель для классификации? - PullRequest
0 голосов
/ 21 февраля 2020

У меня есть набор данных с 2-мя возможными исходами, заболевание по сравнению со здоровым, при поиске биомаркеров есть одна переменная, которая дает AURO C выше, чем модель, построенная из 5 переменных, включающих эту же функцию.

1 Ответ

0 голосов
/ 25 февраля 2020

Трудно ответить на ваш вопрос без дополнительной информации о данных и используемой вами модели.

Вообще говоря, усложнение модели (например, путем добавления дополнительных предикторов) увеличивает риск Подгонка к обучающим данным, которая может привести к плохой производительности тестовых данных.

Другая возможная причина снижения прогнозирующей эффективности при добавлении дополнительных предикторов - мультиколлинеарность между предикторами. Вы можете проверить это, посмотрев корреляции между ними или, в регрессионных моделях, дисперсионные коэффициенты инфляции .

...