download_html () Ошибка в базовом имени (URL): слишком длинный путь в R - PullRequest
0 голосов
/ 04 июня 2019

Я хотел бы загрузить html-код с веб-сайтов, но мой код R возвращает мне следующее: Error in basename(url) : path too long

Пример URL: https://www.amazon.com/VIZIO-1080-Smart-LED-D43-D1/dp/B01A0LGU3O/ref=sxin_3_osp20-8d5e1b7c_cov?ascsubtag=8d5e1b7c-b3a8-4018-9315-b01e2602c1af&creativeASIN=B01A0LGU3O&cv_ct_id=amzn1.osp.8d5e1b7c-b3a8-4018-9315-b01e2602c1af&cv_ct_pg=search&cv_ct_wn=osp-search&keywords=televisore&linkCode=oas&pd_rd_i=B01A0LGU3O&pd_rd_r=6ebe627b-37f8-4a8d-8d6b-e9b1fbb561f2&pd_rd_w=Sc4pX&pd_rd_wg=KAdJs&pf_rd_p=43ba9e17-96f5-4491-b054-e546013f7dc4&pf_rd_r=SR4SDFVDJP5YP89J9F7R&qid=1559599142&s=gateway&tag=bestcont06-20")

, если яиспользуйте функцию download_html() R возвращает это Error in basename(url) : path too long

URL работает, почему R возвращает мне ошибку?

Есть ли способ обойти проблему?

Спасибо заранее

1 Ответ

2 голосов
/ 04 июня 2019

Проблема здесь в том, что download_html() использует basename() для генерации имени для выходного файла:

download_xml(url, file = basename(url))

и basename() не нравится длинный URL - он пытается использовать всепосле последнего / для имени файла.

Самое простое решение - указать собственное имя для выходного файла:

download_xml(your_very_long_url, file = "myfile.html")
...