Как обращаться с пустыми клетками, которые панды не распознают? - PullRequest
0 голосов
/ 30 марта 2019

Я выполняю предварительную обработку данных с использованием методов nlp. Когда я пытаюсь удалить ссылки URL из фрейма данных, строки, содержащие ссылки URL, становятся пустыми записями или не символами ascii. Эти пробелы видны в файле excel, когда я загружаю фрейм данных в формате csv. Однако, когда я реализую следующий код

df.replace('', np.nan, inplace=True) OR
df['columnName'].replace('', np.nan, inplace=True)

этот код выводит, что в кадре данных нет пустых или пустых значений, но на самом деле они есть. Как бороться с этой ситуацией? Я хочу удалить все такие пустые строки

1 Ответ

1 голос
/ 30 марта 2019

Вы можете просто использовать str.strip перед replace

df['columnName']=df['columnName'].str.strip().replace('',np.nan)

Обходной пример

s=pd.Series(['   ','llllll'])
s.str.strip().replace('',np.nan)
0       NaN
1    llllll
dtype: object
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...