Я работаю над проектом по прогнозированию результатов бейсбольного матча, где переменная интереса - это счет домашних команд за вычетом очков гостей (home_score - away_score = scorediff).
> head(final12_18[30:37])
# A tibble: 6 x 8
SLG wOBA wOPS RC BBSOr ID PE scorediff
<dbl> <dbl> <dbl> <dbl> <dbl> <int> <dbl> <dbl>
1 0.356 0.270 0.626 4.26 0.248 9 0.440 -4
2 0.328 0.256 0.584 3.88 0.276 10 0.387 4
3 0.333 0.258 0.591 3.79 0.277 11 0.446 2
4 0.344 0.260 0.604 3.73 0.270 12 0.476 -1
5 0.345 0.266 0.611 3.97 0.364 13 0.470 3
6 0.359 0.277 0.635 4.20 0.515 14 0.5 -1
Если я хочу запустить простую линейную регрессию, как мне настроить модель для поиска положительных или отрицательных значений, а не двоичного результата?
in_train <- createDataPartition(y = final12_18$scorediff, p = 0.8, list = FALSE)
training <- final12_18[in_train,]
testing <- final12_18[-in_train,]
ols <- lm(scorediff == ___ ~ TB + OBP + SLG + wOBA + wOPS + BBSOR + PE, data = training)
Это это то, что у меня есть до сих пор, но я не уверен, что в данном случае установить scorediff равным.