Разбор нескольких файлов для таблиц HTML и добавление одного файла в R - PullRequest
1 голос
/ 23 мая 2011

Это небольшой проект на R, который я пытаюсь выполнить.Я соскоблил несколько сотен HTML-страниц.Я могу использовать функцию reaHTMLTable в библиотеке XML с R для чтения интересующих меня таблиц. Однако у меня возникают проблемы при написании цикла for для циклического перемещения по каталогу, получения таблицы из каждого файла и добавления ихв один CSV-файл.

Я успешно прошел цикл по файлам и сохранил каждую таблицу в один текстовый файл (который я считаю, по крайней мере, началом):

library(XML)     # htmlTreeParse
  parentpath <- "Z:/scraping"
  setwd(parentpath)
  filenames <- list.files()
      for (targetfile in filenames){
      setwd(parentpath)
      data = readHTMLTable(targetfile)
      outputfile <- paste(targetfile,'.txt', sep="")
write.table (data[6], file = outputfile , sep = "\t", quote=TRUE)

1 Ответ

2 голосов
/ 24 мая 2011

Разве опция append = TRUE в write.table не поможет вам?Вы можете прочитать об этом, посмотрев наверх? Write.table.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...