Удалите '\ n' в тексте в pandas python - PullRequest
0 голосов
/ 10 сентября 2018

Следующий код является текущим кодом, который я использую для удаления \ n в столбце ['text']:

df = pd.read_csv('file1.csv')

df['text'].replace('\s+', ' ', regex=True, inplace=True) # remove extra whitespace
df['text'].replace('\n',' ', regex=True) # remove \n in text

header = ["text", "word_length", "author"]

df_out = df.to_csv('sn_file1.csv', columns = header, sep=',', encoding='utf-8')

Я тоже пробовал из предложений:

df['text'].replace('\n', '')
df['text'] = df['text'].str.replace('\n', '').str.replace('\s+', ' ').str.strip()

Вывод: «Какой умник! \ nКак и он знает что-нибудь о сделках с недвижимостью ... '

Код для удаления пробелов работает. Но не в удалении \ n. Кто-нибудь может мне помочь в этом вопросе? Спасибо.

Я тоже пытался решить, основываясь на предложении по этой ссылке удаление новых строк из грязных строк в ячейках данных панд? но это все еще не работает.

Решено:

df['text'].replace(r'\s+|\\n', ' ', regex=True, inplace=True) 
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...