Как настроить модель машинного обучения для считывания положительных или отрицательных значений в R? - PullRequest
0 голосов
/ 21 апреля 2020

Я работаю над проектом по прогнозированию результатов бейсбольного матча, где переменная интереса - это счет домашних команд за вычетом очков гостей (home_score - away_score = scorediff).

> head(final12_18[30:37])
# A tibble: 6 x 8
    SLG  wOBA  wOPS    RC BBSOr    ID    PE scorediff
  <dbl> <dbl> <dbl> <dbl> <dbl> <int> <dbl>     <dbl>
1 0.356 0.270 0.626  4.26 0.248     9 0.440        -4
2 0.328 0.256 0.584  3.88 0.276    10 0.387         4
3 0.333 0.258 0.591  3.79 0.277    11 0.446         2
4 0.344 0.260 0.604  3.73 0.270    12 0.476        -1
5 0.345 0.266 0.611  3.97 0.364    13 0.470         3
6 0.359 0.277 0.635  4.20 0.515    14 0.5          -1

Если я хочу запустить простую линейную регрессию, как мне настроить модель для поиска положительных или отрицательных значений, а не двоичного результата?

in_train <- createDataPartition(y = final12_18$scorediff, p = 0.8, list = FALSE)
training <- final12_18[in_train,]
testing <- final12_18[-in_train,]
ols <- lm(scorediff == ___ ~ TB + OBP + SLG + wOBA + wOPS + BBSOR + PE, data = training)

Это это то, что у меня есть до сих пор, но я не уверен, что в данном случае установить scorediff равным.

...