Денормализация подмножества нормализованных данных в Python - PullRequest
0 голосов
/ 04 июля 2018

Я новичок в Python и строю модель случайного леса на основе набора данных. Мои исходные данные содержат 33000 строк с 4 столбцами. Я нормализовал его по следующей формуле:

normalized_df = (mydata-mydata.mean()) / mydata.std()

Теперь, после выполнения случайного леса, у меня есть фрейм данных, в котором есть мои прогнозы, фактические данные и все тестовые функции (т.е. 9000 строк и 5 столбцов). Я попытался нормализовать его, используя следующую формулу:

denorm_df = (normalized_pred_df * mydata.std() ) + mydata.mean()

Это приводит к значениям NAN в большинстве моих столбцов информационного кадра.

1 Ответ

0 голосов
/ 05 июля 2018

Рассмотрите возможность использования StandardScaler из sklearn, и это функция invert_transform ().

...