(R) объединить текст из нескольких текстовых файлов в одну непрерывную текстовую единицу - PullRequest
0 голосов
/ 09 марта 2019

У меня 257 .txt файлов, у каждого есть набор стенограмм Q + A.Я хочу извлечь текст каждого из них в один вектор в R. Большинство связанных вопросов включают чтение нескольких файлов в фрейм данных или таблицу, я не хочу ни одного из них, просто огромный кусок текста.

Я успешно получил все файлы в:

QA_all <- choose.files()

Но кроме этого я в тупике.Решение, упомянутое здесь: Импортируйте несколько текстовых файлов в R и присваивайте им имена из заранее определенного списка

, казалось, приблизительно соответствует тому, что я хочу, но это какой-то список.Мне удалось извлечь элементы текста из списка в вектор, а затем сгладить его и удалить строки:

#extract text from files and put in a vector
data_list = lapply(QA_all, function(file) scan(file, what = "character"))

text <- c(data_list[1:257])
flat.list <- unlist(text, recursive = TRUE, use.names = TRUE)

#remove lines
QA.vector <- paste(flat.list, collapse=" ")

, но мне интересно, могу ли я сделать это напрямую, не создавая список с помощью lapply ().Я хочу знать, есть ли более прямой способ извлечь текст из нескольких файлов и поместить их в непрерывную единицу текста в R.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...