Я новичок в R
делаю мой первый случай предсказания
Я использую данные об энергии с этого сайта
http://archive.ics.uci.edu/ml/datasets/Energy+efficiency#
Я загрузил данные в таблицу SQL Server
проблема в том, что когда я использую эти факторы (Surface, Wall, and Roof)
Я получаю это предупреждение
Warning message:
In predict.lm(lr_learn, Pred_Data) :
prediction from a rank-deficient fit may be misleading
Если я использую любые 2 из них с любыми другими факторами, я получаю свои результаты
только когда я использую эти 3 фактора в одиночку или с другими факторами, я получаю предупреждение
Я не знаю, почему и задаюсь вопросом, может ли кто-нибудь помочь мне понять, что происходит
это мой код
library("RODBC")
con <- odbcConnect("SQLServer")
TData <- sqlQuery(con,"select * from energy where id % 10 <> 0")
PData <- sqlQuery(con,"select * from energy where id % 10 = 0")
Test_Data <- data.frame(Surface=TData$Surface, Wall=TData$Wall, Roof=TData$Roof, HeatingLoad=TData$HeatingLoad)
Pred_Data <- data.frame(Surface=PData$Surface, Wall=PData$Wall, Roof=PData$Roof)#, HeatingLoad=PData$HeatingLoad)
lr_learn <- lm(HeatingLoad~., Test_Data)
#Getting warning here
lr_pred <- predict(lr_learn, Pred_Data)
Это данные 3 факторов
Surface Wall Roof
--------------------
514.5 294 110.25
563.5 318.5 122.5
588 294 147
612.5 318.5 147
637 343 147
661.5 416.5 122.5
686 245 220.5
710.5 269.5 220.5
735 294 220.5
759.5 318.5 220.5
784 343 220.5
808.5 367.5 220.5