У меня есть несколько работ по анализу через Python и Selen. Вот моя ссылка в источнике HTML:
<а class = "NQWMenuItem" name = "SectionElements"
HREF = "JavaScript: недействительным (нуль);"
OnClick = "NQWClearActiveMenu ();? Скачать ( 'saw.dll Go & _scid = RQqdowdFKUY & ViewID = d \ x253adashboard \ x257ep \ x253a6umggrpo8urqvbmv \ x257er \ x253a67dmsf5fpr8csc50 & Action = Скачать и SearchID = hmd09g8fe17dagu1l8l463e856 & PortalPath = / общий / \ x25d0 \ x25a1 \ x25d0 \ x25b5 \ x25d1 \ x2580 \ x25d0 \ x25B2 \ x25d0 \ x25b8 \ x25d1 \ x2581 / _portal / \ x25d0 \ x25a1 \ x25d0 \ x25b5 \ x25d1 \ x2580 \ x25d0 \ x25B2 \ x25d0 \ x25b8 \ x25d1 \ x2581 \ x2520- \ x2520 \ x25d0 \ x2597 \ x25d0 \ x259e \ x2520 \ x25d0 \ x25b8 \ x2520 \ x25d0 \ x2597 \ x25d0 \ x25bd \ x25d0 \ x25a0 & Page = \ x25d0 \ x2597 \ x25d0 \ x259e \ x2520 \ x25d0 \ x25b7 \ x25d0 \ x25b0 \ x25d0 \ x25b4 \ x25d0 \ x25b0 \ x25d1 \ x2587 \ x25d0 \ x25b0 \ x2520 \ x25d0 \ x2597 \ x25d0 \ x25bd \ x25d0 \ x25a0 & ViewState = 4e0eaq3qdoiuvg7v7e2ke0u78i & ItemName = \ x25d0 \ x25bf \ x25d1 \ x2580 \ x25d0 \ x25b5 \ x25d0 \ x25b4 \ x25d1 \ x2581 \ x25d1 \ x2582 \ x25d0 \ x25b0 \ x25d0 \ x25B2 \ x25d0 \ x25bb \ x25d0 \ x25b5 \ x25d0 \ x25bd \ x25d0 \ x25b8 \ x25d0 \ x25b5 \ x253a \ x2520 \ x25d0 \ x2597 \ x25d0 \ x259e \ x2520 \ x25d0 \ x25b7 \ x25d0 \ x25b0 \ x25d0 \ x25b4 \ x25d0 \ x25b0 \ x25d1 \ x2587 \ x25d0 \ x25b0 \ x2520 \ x25d0 \ x2597 \ x25d0 \ x25bd \ x25d0 \ x25a0 & Формат = Excel2000 & E XTension = .xls');
return false "style =" "> Загрузить из сети в Excel 2000
Я получаю onclick str (вот URL нужного мне документа), но есть русские символы в кодировке: \ x25b0, \ x25d0, \ x25b5 и т. Д.
Когда я нажимаю на эту ссылку в моем браузере, URL будет:
http://ld3ap03.htsk.ru:7777/analytics/saw.dll?Go&_scid=RQqdowdFKUY&ViewID=d:dashboard~p:6umggrpo8urqvbmv~r:67dmsf5fpr8csc50&Action=Download&SearchID=hmd09g8fe17dagu1l8l463e856&PortalPath=/shared/Сервис/_portal/Сервис
- ЗО и ЗнР & Page = ЗО задача ЗнР & ViewState = 4e0eaq3qdoiuvg7v7e2ke0u78i & ItemName = представление: ЗО
задача ЗнР & Формат = excel2000 & Расширение = .xls
Как вы можете видеть, нет символов, закодированных в \ x.
Что такое \ x кодировка? Как я могу получить правильный URL? Я использую Python.