установить корпус как список R - PullRequest
0 голосов
/ 17 декабря 2018

У меня есть набор текстовых файлов, которые мне нужно преобразовать в виде списка, чтобы применить эту функцию тестирования, которая экспортирует файлы, содержащие термин «америка», но он возвращает отсутствие файла, пока я уверен в правильностипуть

files <- list.files( full.names=TRUE)
matches <- sapply(files, function(x) {
  conn <- file(x, open="r")
  count <- length(grep("\\b tunisia\\b", readLines(conn)))
  return(count > 0)
})
  Error in files[matches] : invalid subscript type 'list'

Я попробовал два метода для адаптации данных, но у меня нет нужного результата

  1. Я напрямую преобразовываю корпус в массив данных, затем перечисляю
corp<-data.frame(text = sapply(mycorpus, as.character), stringsAsFactors = FALSE)
Error in (function (..., row.names = NULL, check.rows = FALSE, check.names = TRUE,  : 
  les arguments impliquent des nombres de lignes différents : 9, 7, 8, 5, 3
сохранить текстовые файлы и перечитать, а затем снова;но эта функция всегда возвращает нулевой список
install.packages("foreign")
library("foreign")
setwd("res")
files <-list.files()
data <- 0
for (f in files) {
  tempData = scan( f, what="character")
  data <- c(data,tempData)    
}
    > data
   [1] 0

Каким бы ни был метод, я просто хочу, чтобы предварительно обработанные файлы, содержащиеся в корпусе, стали списком файлов

...