У меня есть набор данных, который выглядит следующим образом:
![dataset](https://i.stack.imgur.com/tOV9k.png)
Меня интересует наилучшая возможная мультилинейная регрессия, поэтому я пытаюсь использовать этот метод LASSO.
R, которая обозначает доходность фондового рынка, должна быть зависимой переменной, тогда как все остальные (кроме D / Date и P / Price) являются независимыми переменными.
Вот что я попробовал:
library(Matrix)
library(foreach)
library(glmnet)
trainX <- spxdata[c(4:11)]
trainY <- spxdata[c(3)]
CV = cv.glmnet(x = trainX, y = trainY, alpha = 1, nlambda = 100)
и это дает мне следующее сообщение об ошибке:
Error in storage.mode(y) <- "double" : (list) object cannot be coerced to type 'double'
Я не привык к R и использую его редко, поэтому не знаю, как решить эту проблему. Я полагаю, это как-то связано с форматом моего подмножества trainX и trainY, но что именно я здесь сделал неправильно?