Как обрабатывать нулевые записи в нормальном распределении - PullRequest
0 голосов
/ 26 февраля 2020

Я работаю с набором данных kaggle house. Я пытаюсь использовать нейронные net для этого на практике. Я пытаюсь нормализовать данные. Моя проблема заключается в следующем: у меня есть одна переменная BsmtFinSF1, которая относится к «типу 1 законченный квадратный фут» и имеет множество значений, равных 0. Нулевое значение соответствует «без фундамента», что, фактически, в другой факторной переменной соответствует уровень. Например, если переменная «Basement Condition» соответствует «No Basement», это означает, что переменная BsmtFinSF1 будет равна 0. Ниже приведена гистограмма BsmtFinSF1. Если я не ошибаюсь из-за своей новизны, если бы не было нулей, распределение было бы нормальным. Как я могу нормализовать это или я должен даже нормализовать это?

Histogram

...