Вы обучаете свою модель не по предварительно обработанным данным, а по необработанным данным, а затем оцениваете их по предварительно обработанным данным. Данные должны иметь одинаковые масштабы во время обучения и тестирования.
Может быть, распечатать статистику (диапазон, среднее) переменной интереса («цена»). Я предполагаю, что цель состоит в том, чтобы предсказать цены на жилье. Я предполагаю, что единица цен на жилье - доллары, так что это будут большие цифры. В случае, если ваша зависимая переменная велика, даже небольшие относительные ошибки могут привести к большим потерям, особенно с MSE.
Я бы порекомендовал также нормализовать данные о ценах и обучить модель на масштабированных версиях данных x, y
Уменьшается ли потеря как минимум во время обучения?
Надеюсь, это немного поможет!