У меня 257 .txt файлов, у каждого есть набор стенограмм Q + A.Я хочу извлечь текст каждого из них в один вектор в R. Большинство связанных вопросов включают чтение нескольких файлов в фрейм данных или таблицу, я не хочу ни одного из них, просто огромный кусок текста.
Я успешно получил все файлы в:
QA_all <- choose.files()
Но кроме этого я в тупике.Решение, упомянутое здесь: Импортируйте несколько текстовых файлов в R и присваивайте им имена из заранее определенного списка
, казалось, приблизительно соответствует тому, что я хочу, но это какой-то список.Мне удалось извлечь элементы текста из списка в вектор, а затем сгладить его и удалить строки:
#extract text from files and put in a vector
data_list = lapply(QA_all, function(file) scan(file, what = "character"))
text <- c(data_list[1:257])
flat.list <- unlist(text, recursive = TRUE, use.names = TRUE)
#remove lines
QA.vector <- paste(flat.list, collapse=" ")
, но мне интересно, могу ли я сделать это напрямую, не создавая список с помощью lapply ().Я хочу знать, есть ли более прямой способ извлечь текст из нескольких файлов и поместить их в непрерывную единицу текста в R.