не выбирая пропущенные значения? - PullRequest
1 голос
/ 30 мая 2019

есть DF med562.Категориальная переменная имеет распределение ниже

I    6119923

O     764905

      166666

Name: IND, dtype: int64

Требуется просто вменять пропущенные значения 166666, используя значение I, которое состоит из 6119923 строк.Написал это

med562['IND']=med562['IND'].fillna(value='I')

Catcounts=med562.IND.value_counts(dropna=False)

Catcounts

Не изменилось, все тот же дистрибутив.Это работает на Python 3.7.3.Не должно быть проблем с программным обеспечением.Есть мысли?Спасибо.

1 Ответ

1 голос
/ 30 мая 2019

Это не NaN, это пробел, если это NaN, когда вы делаете value_counts, он не будет отображаться в результате, так как dropna=True в value_counts по умолчанию имеет значение True

med562['IND']=med562['IND'].replace({'':'I'})

Catcounts=med562.IND.value_counts(dropna=False)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...