Я читаю текстовый файл в R:
text <- read_delim("textfile.txt", "\n", escape_double = F, col_names = F, trim_ws = T)
Соответствующая часть заключается в том, что он разделен переносами строк.Затем я разделяю его на колонку оратора и колонку комментариев:
text2 <- text %>%
separate(X1, into = c("speaker", "comment"), sep = ":")
В результате получается фрейм данных с колонкой ораторов и другим столбцом их комментариев.
Проблема заключается в том, чтов некоторых длинных комментариях есть разрывы строк.Это портит структуру данных, помещая комментарий после разрыва строки в колонке спикера и затем NA в разделе комментариев.
Как я могу сказать R игнорировать эти встроенные разрывы строк?Если это помогает, столбцы разделяются двоеточием (т. Е. Интервьюер: как дела?), Поэтому перед «истинным» переводом строки должен быть только один двоеточие.
Спасибо!