Очистка (загрузка) набора данных на открытом сайте данных по ссылке - PullRequest
0 голосов
/ 21 сентября 2019

У меня есть список ссылок, который указывает на веб-страницы, каждая из которых содержит набор данных и графическую визуализацию.Я хотел бы создать код R, который будет обращаться к каждой странице и загружать набор данных.

Например, по этой ссылке: http://burkinafaso.opendataforafrica.org/ajcalpd/accidents-de-la-circulation-constat%C3%A9s-par-la-gendarmerie-nationale Когда вы выбираете набор данных в меню справа, набор данныхотображается.например: https://drive.google.com/file/d/1ffUfEVkIawmLiLRJariBP_DNCoyuHr9q/view

Когда я использую функцию R download.File , она отправляет мне html (xml) контент.

Вот, например, первыйтри (3) ссылки в списке:

[1] "http://burkinafaso.opendataforafrica.org/ajcalpd/accidents-de-la-circulation-constatés-par-la-gendarmerie-nationale"

[2]" http://burkinafaso.opendataforafrica.org/zuzgjhe/accidents-de-la-circulation-routière-constatés-par-la-police-nationale"

[3] "http://burkinafaso.opendataforafrica.org/unlnaq/activité-et-chômage-à-ouagadougou-en-2001"

Вот код, который я сделал для загрузки набора данных, содержащегося в первой ссылке.

link <- 'http://burkinafaso.opendataforafrica.org/ajcalpd/accidents-de-la-circulation-constatés-par-la-gendarmerie-nationale'
downloadImages <- function(files, name, outPath){
  for(i in 1:length(files)){
    download.file(files, destfile = paste0(outPath, "/", name, "_", i, ".txt"), mode = 'wb')
  }

}
outPath="E:/opendata"
name="data"
downloadImages(link,name, outPath)

В финале я хочу загрузить данные по каждой ссылке в (csv, json,или преуспеть, ...).

...