R: предупреждающее сообщение: прогноз на основе ранга с недостаточным рангом может вводить в заблуждение - PullRequest
0 голосов
/ 31 августа 2018

Я новичок в R делаю мой первый случай предсказания

Я использую данные об энергии с этого сайта

http://archive.ics.uci.edu/ml/datasets/Energy+efficiency#

Я загрузил данные в таблицу SQL Server

проблема в том, что когда я использую эти факторы (Surface, Wall, and Roof)

Я получаю это предупреждение

Warning message:
In predict.lm(lr_learn, Pred_Data) :
  prediction from a rank-deficient fit may be misleading

Если я использую любые 2 из них с любыми другими факторами, я получаю свои результаты

только когда я использую эти 3 фактора в одиночку или с другими факторами, я получаю предупреждение

Я не знаю, почему и задаюсь вопросом, может ли кто-нибудь помочь мне понять, что происходит

это мой код

library("RODBC")
con <- odbcConnect("SQLServer")
TData <- sqlQuery(con,"select * from energy where id % 10 <> 0")
PData <-  sqlQuery(con,"select * from energy where id % 10 = 0")
Test_Data <- data.frame(Surface=TData$Surface, Wall=TData$Wall, Roof=TData$Roof, HeatingLoad=TData$HeatingLoad) 
Pred_Data <- data.frame(Surface=PData$Surface, Wall=PData$Wall, Roof=PData$Roof)#, HeatingLoad=PData$HeatingLoad) 
lr_learn <- lm(HeatingLoad~., Test_Data)

#Getting warning here
lr_pred <- predict(lr_learn, Pred_Data)

Это данные 3 факторов

Surface Wall    Roof
--------------------
514.5   294     110.25
563.5   318.5   122.5
588     294     147
612.5   318.5   147
637     343     147
661.5   416.5   122.5
686     245     220.5
710.5   269.5   220.5
735     294     220.5
759.5   318.5   220.5
784     343     220.5
808.5   367.5   220.5
...