Возникли проблемы при работе со значениями NA в столбце YEAR - PullRequest
1 голос
/ 14 февраля 2020

Я пытался очистить набор данных жилья, чтобы построить модель. Я застрял на шаге, где у меня было NA значения в столбце GarageYrBlt. В доме нет гаража, поэтому в колонке GarageYrBlt находится NA. Как я должен справиться с ними?

Вот мой набор данных:

  Id GarageType GarageYrBlt
1  1     Attchd        2003
2  2     Attchd        1976
3  3     Attchd        2001
4  4     Detchd        1998
5  5     Attchd        2000
6  6     No Garage       NA

Это только примеры строк. У меня большой набор данных с большим количеством значений NA.

1 Ответ

0 голосов
/ 22 апреля 2020

Год может быть полезной функцией как для регрессии, так и для проблемы классификации. В этом случае вы можете попробовать пометить кодировку столбца года, чтобы все значения NA имели один код. Поскольку этот столбец связан с типом Garage, как вы упомянули лучше не удалять эти строки.

Надеюсь, что это полезно. Спасибо

...