Python: замена буквенно-цифровых значений в Dataframe - PullRequest
0 голосов
/ 11 мая 2018

У меня есть слова с \ t и \ r в начале слов, которые я пытаюсь вырезать, не удаляя фактические слова.

Например "\tWant to go to the mall.\rTo eat something."

Я пробовал несколько вещей из SO в течение трех дней. Это DataPrame от Pandas, поэтому я подумал, что этот ответ был лучшим:

Pandas DataFrame: удаление ненужных частей из строк в столбце

Но формулирование этого для моего собственного решения не работает.

i = df['Column'].replace(regex=False,inplace=False,to_replace='\t',value='')

Я не хотел использовать регулярные выражения, поскольку было трудно создать выражение, которое я пытаюсь вырезать из '\ t' и, если возможно, также из '\ r'.

Вот мое регулярное выражение: https://regex101.com/r/92CUV5/5

1 Ответ

0 голосов
/ 11 мая 2018

Попробуйте следующий код:

def remove_chars(text):
    return str(re.sub(r'[\t\r]','',text))

i = df['Column'].map(remove_chars)
...