Question

Я новичок в Python и строю модель случайного леса на основе набора данных. Мои исходные данные содержат 33000 строк с 4 столбцами. Я нормализовал его по следующей формуле:

normalized_df = (mydata-mydata.mean()) / mydata.std()

Теперь, после выполнения случайного леса, у меня есть фрейм данных, в котором есть мои прогнозы, фактические данные и все тестовые функции (т.е. 9000 строк и 5 столбцов). Я попытался нормализовать его, используя следующую формулу:

denorm_df = (normalized_pred_df * mydata.std() ) + mydata.mean()

Это приводит к значениям NAN в большинстве моих столбцов информационного кадра.

jonnor · Answer 1 · 05 июля 2018

Рассмотрите возможность использования StandardScaler из sklearn, и это функция invert_transform ().

Денормализация подмножества нормализованных данных в Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Денормализация подмножества нормализованных данных в Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы