R read_excel из онлайн-ссылки на веб-страницу создает пустой фрейм данных - PullRequest
0 голосов
/ 03 июля 2018

Привет, это мой первый раз, Я пытаюсь получить данные из списка ссылок на веб-страницу. Тем не менее, он работает для других ссылок на странице, но не для конкретной ссылки, которая возвращает пустой фрейм данных.

library(readxl)

download.file("https://www.parismou.org/sites/default/files/2016-04-DetentionLists_0.XLS","test.xls",mode="wb")
tbls=read_excel("test.xls")

Загрузка в виде файла .xls работает нормально, но чтение не работает. Я также пытался использовать:

tbls=read.table("https://www.parismou.org/sites/default/files/2016-04-DetentionLists_0.XLS", header=TRUE, skipNul= TRUE) 

, который возвращает:

Error in read.table("https://www.parismou.org/sites/default/files/2016-04-DetentionLists_0.XLS",  : 
  no lines available in input

Я также пробовал пакеты XLConnect, но те вернули следующую ошибку:

require(XLConnect)
download.file("https://www.parismou.org/sites/default/files/2016-04-DetentionLists_0.XLS","test.xls",mode="wb")
tblspx=loadWorkbook("test.xls")

Error: OldExcelFormatException (Java): The supplied spreadsheet seems to be Excel 5.0/7.0 (BIFF5) format. POI only supports BIFF8 format (from Excel versions 97/2000/XP/2003)

Любая помощь будет принята с благодарностью.

1 Ответ

0 голосов
/ 03 июля 2018

Вы имеете дело с очень старым форматом Excel. Пакет gdata может справиться с этим (см. ТАК сообщение ):

install.packages("gdata")
require(readxl)

download.file("https://www.parismou.org/sites/default/files/2016-04-DetentionLists_0.XLS","test.xls",mode="wb")

tbls = gdata::read.xls("test.xls", fileEncoding="latin1")
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...