Я пытаюсь очистить набор данных в пандах, информация хранится в CSV-файле и импортируется с использованием:
tester = pd.read_csv('date.csv')
Каждый столбец содержит '?'где значение отсутствует.Например, есть столбец возраста, который содержит 9 вопросительных знаков (?)
Я пытаюсь установить для всех знаков вопроса значение NaN, я пытался:
tester = pd.read_csv('date.csv', na_values=["?"])
tester['age'].replace("?", np.NaN)
tester.replace('?', np.NaN)
for col in tester :
print tester[col].value_counts(dropna=False)
Все еще возвращает 0для возраста, когда я знаю, есть 9 (?).В этом случае я предполагаю, что проверка не пройдена, так как значение никогда не рассматривается как?.
Я посмотрел файл csv на странице заметок, и вокруг символа нет пробела и т. Д.
Есть ли способ заставить это распознать?
Пример данных: 