У меня есть набор текстовых файлов, которые мне нужно преобразовать в виде списка, чтобы применить эту функцию тестирования, которая экспортирует файлы, содержащие термин «америка», но он возвращает отсутствие файла, пока я уверен в правильностипуть
files <- list.files( full.names=TRUE)
matches <- sapply(files, function(x) {
conn <- file(x, open="r")
count <- length(grep("\\b tunisia\\b", readLines(conn)))
return(count > 0)
})
Error in files[matches] : invalid subscript type 'list'
Я попробовал два метода для адаптации данных, но у меня нет нужного результата
- Я напрямую преобразовываю корпус в массив данных, затем перечисляю
corp<-data.frame(text = sapply(mycorpus, as.character), stringsAsFactors = FALSE)
Error in (function (..., row.names = NULL, check.rows = FALSE, check.names = TRUE, :
les arguments impliquent des nombres de lignes différents : 9, 7, 8, 5, 3
сохранить текстовые файлы и перечитать, а затем снова;но эта функция всегда возвращает нулевой список
install.packages("foreign")
library("foreign")
setwd("res")
files <-list.files()
data <- 0
for (f in files) {
tempData = scan( f, what="character")
data <- c(data,tempData)
}
> data
[1] 0
Каким бы ни был метод, я просто хочу, чтобы предварительно обработанные файлы, содержащиеся в корпусе, стали списком файлов