Какой подход лучше для моделирования? - PullRequest
0 голосов
/ 26 апреля 2020
all['Area_Type'].value_counts()

DownTown              5577
MidTownResidential    1083
CityLimits             935
Industrial             928
Name: Area_Type, dtype: int64

Это количество значений столбца с именем Area_Type. Лучше создать фиктивные переменные для этой категориальной переменной или преобразовать их в нумерацию c, используя это

all['Area_Type']=all['Area_Type'].map({"DownTown":1,
                                       "MidTownResidential":2, 
                                       "CityLimits":3,
                                       "Industrial":4})

, что более осуществимо. И как оба влияют на работу алгоритмов при моделировании?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...