Я пытаюсь использовать линейную регрессию, чтобы выяснить наилучшее взвешивание для 3 моделей, чтобы предсказать результат.Таким образом, есть 3 переменные (x1, x2, x3)
, которые являются предсказаниями зависимой переменной y
.У меня вопрос, как мне запустить регрессию с ограничением, что сумма коэффициентов равна 1. Например:
это хорошо:
y = .2(x1) + .4(x2) + .4(x3)
с .2 + .4 + .4 = 1
это не хорошо:
y = 1.2(x1) + .4(x2) + .3(x3)
, поскольку 1.2 + .4 + .3 > 1
Я собираюсь сделать это в R, если это возможно.Благодарю.Дайте мне знать, если это необходимо переместить в область статистики («Перекрестная проверка»).
РЕДАКТИРОВАТЬ:
Проблема состоит в том, чтобы классифицировать каждую строку как 1 или 0. y являетсяфактические значения (0 или 1) из обучающего набора, x1 - это прогнозируемые значения из модели kNN, x2 - из randomForest, x3 - из модели gbm.Я пытаюсь получить наилучшие весовые коэффициенты для каждой модели, поэтому каждый коэффициент равен <= 1, а сумма коэффициентов == 1. Будет выглядеть примерно так: </p>
y/Actual value knnPred RfPred gbmPred
0 .1111 .0546 .03325
1 .7778 .6245 .60985
0 .3354 .1293 .33255
0 .2235 .9987 .10393
1 .9888 .6753 .88933
... ... ... ...
Показатель успехаППК.Поэтому я пытаюсь установить коэффициенты, чтобы максимизировать AUC, при этом убедившись, что они составляют 1.