Это небольшой проект на R, который я пытаюсь выполнить.Я соскоблил несколько сотен HTML-страниц.Я могу использовать функцию reaHTMLTable в библиотеке XML с R для чтения интересующих меня таблиц. Однако у меня возникают проблемы при написании цикла for для циклического перемещения по каталогу, получения таблицы из каждого файла и добавления ихв один CSV-файл.
Я успешно прошел цикл по файлам и сохранил каждую таблицу в один текстовый файл (который я считаю, по крайней мере, началом):
library(XML) # htmlTreeParse
parentpath <- "Z:/scraping"
setwd(parentpath)
filenames <- list.files()
for (targetfile in filenames){
setwd(parentpath)
data = readHTMLTable(targetfile)
outputfile <- paste(targetfile,'.txt', sep="")
write.table (data[6], file = outputfile , sep = "\t", quote=TRUE)