Я загружаю файл .csv в виде строки на R с помощью readLines (). Один из столбцов содержит твиты с нежелательными переносами строк.
Мне нужно удалить разрывы строк. В Notepad ++ работает Поиск: \r\n
и Замена на %%%
, и весь файл превращается в одну строку.
Однако при выполнении этого в R ни str_replace_all()
, ни str_remove_all()
не обнаружат \\r\\n
, и выходной файл будет идентичен входному. Это мой код Я пробовал следующее RegEx: "\n"
; "\r\n"
; "\\n"
; "\\r\\n"
; "\\r"
безрезультатно.
tx <- readLines("line_breaks.csv", warn = FALSE)
tx <- str_replace_all(tx, "\\r\\n", "")
write_lines(tx, "C:/Users/u0126720/Documents/csv_test/one_line.csv")
Я также пробовал:
tx <- str_remove_all(tx, "\\r\\n")
Входной файл выглядит так:
date,tweet
Wed Jun 19 2019, Como pretendia ser un angel , estando rodeada de demonios? ✨
Rp.?
hola, estas en la olla?"
Желаемый вывод (и что я получаю с помощью Notepad ++):
Wed Jun 19 2019, Como pretendia ser un angel , estando rodeada de demonios? ✨Rp.?hola, estas en la olla?"