Следующий код является текущим кодом, который я использую для удаления \ n в столбце ['text']:
df = pd.read_csv('file1.csv')
df['text'].replace('\s+', ' ', regex=True, inplace=True) # remove extra whitespace
df['text'].replace('\n',' ', regex=True) # remove \n in text
header = ["text", "word_length", "author"]
df_out = df.to_csv('sn_file1.csv', columns = header, sep=',', encoding='utf-8')
Я тоже пробовал из предложений:
df['text'].replace('\n', '')
df['text'] = df['text'].str.replace('\n', '').str.replace('\s+', ' ').str.strip()
Вывод: «Какой умник! \ nКак и он знает что-нибудь о сделках с недвижимостью ... '
Код для удаления пробелов работает. Но не в удалении \ n. Кто-нибудь может мне помочь в этом вопросе? Спасибо.
Я тоже пытался решить, основываясь на предложении по этой ссылке удаление новых строк из грязных строк в ячейках данных панд? но это все еще не работает.
Решено:
df['text'].replace(r'\s+|\\n', ' ', regex=True, inplace=True)