Я новичок в Python и строю модель случайного леса на основе набора данных.
Мои исходные данные содержат 33000 строк с 4 столбцами. Я нормализовал его по следующей формуле:
normalized_df = (mydata-mydata.mean()) / mydata.std()
Теперь, после выполнения случайного леса, у меня есть фрейм данных, в котором есть мои прогнозы, фактические данные и все тестовые функции (т.е. 9000 строк и 5 столбцов).
Я попытался нормализовать его, используя следующую формулу:
denorm_df = (normalized_pred_df * mydata.std() ) + mydata.mean()
Это приводит к значениям NAN в большинстве моих столбцов информационного кадра.