удалить специальные символы и строки из столбцов df в python - PullRequest
0 голосов
/ 01 июля 2019

В настоящее время мой столбец имеет тип объекта, и я пытаюсь преобразовать его в числовой тип.Но он показывает ошибку из-за специальных символов и строки, содержащейся в нем.

ошибка:

ValueError: Unable to parse string "7`" at position 3298

код:

data['col1']=pd.to_numeric(data.col1)

Итак, я хочу удалитьспециальный символ и строка из столбцов, для которых требуется только число и столбец col1.Любое предлагаемое решение?

1 Ответ

2 голосов
/ 01 июля 2019

Использование str.replace с регулярным выражением.

Пример:

df = pd.DataFrame({"col1": ["7`", "123", "AS123", "*&%3R4"]})
print(pd.to_numeric(df['col1'].str.replace(r"[^\d]", "")))

Выход:

0      7
1    123
2    123
3     34
Name: col1, dtype: int64
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...