У меня есть непрерывная переменная 'nro_repro', которая имеет 40 NaN, я хочу сгруппировать ее в три диапазона: (-inf; 0), (0: + inf) и MISSING.
Когда я делаю группировку в varaible, она не показывает мне третью категорию (пропущенные значения)
Как мне сделать сувенир этой проблемы?
С уважением, Хьюго
train_sm1['nro_repro'].isnull().sum()
Out[21]: 40
bin = [-np.inf,0,np.inf]
category = pd.cut(train_sm1['nro_repro'],bin)
category = category.to_frame()
category.columns = ['R_nro_repro']
train_sm1 = pd.concat([train_sm1,category],axis = 1)
pd.crosstab(train_sm1['R_nro_repro'],columns='count')
col_0 count
R_nro_repro
(-inf, 0.0] 62885
(0.0, inf] 6173