Набор данных Keras стандартизировать против нормализовать - PullRequest
0 голосов
/ 10 июля 2019

Я использую модель Keras (TF2.0beta), чтобы поиграть с пользовательским набором данных. Набор обучающих данных содержит ~ 400 записей, 8 столбцов / функций, 1 метку. Моя цель состоит в том, чтобы обучить, а затем предсказать метки, используя отдельный набор данных проверки. Важными функциями являются float32, но они имеют совершенно разные диапазоны.

Многие онлайн-примеры нормализуют каждую функцию в диапазоне 0-1. НЕКОТОРЫЕ примеры статистически стандартизируют каждую функцию, используя (X-Xmean) / Xstd. (FWIW, Панды - это белая магия!)

Я думаю Я хочу стандартизировать функции. Нормализация функций просто исказила бы обучение, которое мне кажется.

Итак, когда я должен статистически нормализовать и когда я должен статистически стандартизировать функции?

...