Я пытаюсь обработать пропущенные значения в моем наборе данных. Я использую pandas в Python 3. У меня есть столбец «имя», который должен содержать только имена людей, но он также содержит случайные числа. Как я могу удалить их или изменить их на NaN, чтобы потом я мог их отбросить или заполнить новыми именами. Вот как я обработал первые пропущенные значения:
df_test["name"] = df_test['name'].astype(str)
df_test['name'].replace('-inf', np.nan, inplace=True)
df_test['name'].replace('0', np.nan, inplace=True)
df_test
Вывод:
name
1 NaN
2 NaN
3 29014
...
10 21893
11 Amber Rose
Итак, первые два значения были '-inf' и '0', я заменил их на NaN, но как заменить случайные числа в строковом столбце? Должен ли я сделать это вручную?