Как обрабатывать пропущенные значения в столбце bool в python? - PullRequest
1 голос
/ 10 мая 2019

У меня есть логический столбец

df['Employed'].dtypes
Out[3]: dtype('O')

значения, показывающие

df['Employed'].value_counts()
Out[4]:
False    156133
True      13271
Name: Self_Employed2, dtype: int64

уникальное отображение nan

df['Employed'].unique()
Out[5]:array([nan, False, True], dtype=object)

Количество пропущенных

df['Employed'].isnull().sum()
Out[6]: 21210

Я пытаюсь преобразовать логическое значение в строку и изменить «nan» на «False», затем изменить «False» на «No» и «True» на «Yes», ​​Triied для преобразования «nan» в «False» с использованием fillna(Ложь), это не работает. Попытка использования str.replace ('Ложь', 'Нет'), который также не работает

Мне нужно

Out[7]:
False    177343
True      13271
Name: Employed, dtype: int64

1 Ответ

0 голосов
/ 10 мая 2019

Вы можете использовать попытку заменить отсутствующие значения на Series.fillna на False без ' для логического значения:

df.Employed = df.Employed.fillna(False)

Или удалить пропущенные значения с помощью Series.dropna:

df.Employed = df.Employed.dropna()
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...