Заполнение пропущенных значений, когда столбец имеет нечисловые значения в Pandas - PullRequest
0 голосов
/ 03 марта 2019

Я хочу заполнить пропущенные значения, но столбец содержит не числовые значения, поэтому я не могу заполнить, используя среднее значение и медиану

Страна
Индия
Индия
США
NaN
Индия

так вот как я могу заменить NAN Индией, потому что Индия - максимальное время, которое я пробовал с классом Imputer, но он не работает

from sklearn.preprocessing import Imputer
imputer = Imputer(missing_values = 'NaN', strategy = 'median', axis = 0)
imputer = imputer.fit(train_x[:,0])
train_x[:,0] = imputer.transform(train_x[:,0])

Ответы [ 2 ]

0 голосов
/ 03 марта 2019

Попробуйте:

df.fillna(df['Country'].mode()[0], inplace=True)

0 голосов
/ 03 марта 2019

Использование mode с fillna

df=df.fillna(df.mode().iloc[0])
df
  Country
0   India
1   India
2     USA
3   India
4   India
...