Изначально у вас есть 200 наблюдений в y и 4 объекта (столбца) в X, которые вы затем масштабируете и преобразуете в полиномиальные элементы.
Степень 4, таким образом, имеет 120 <200 полиномиальных элементов, тогда как степень 5 равнапервый имеет 210> 200 полиномиальных признаков, а именно больше признаков, чем наблюдений.
Когда имеется больше признаков, чем наблюдений, линейная регрессия плохо определена и не должна использоваться, как объяснено здесь .Это может объяснить внезапное ухудшение подгонки набора поездов при переходе от степени 4 к степени 5. Похоже, что для более высоких степеней решатель LR был в состоянии превзойти данные поезда.