Как вы видите страницу, защищенную аутентификацией Шибболет? - PullRequest
2 голосов
/ 28 мая 2011

Я пытаюсь удалить данные со страниц, защищенных аутентификацией Шибболет.У меня были проблемы с корректной работой cURL и webisoget.Итак, я пробую wget, потому что я думал, что смогу передать свой сертификат и получить нужные мне страницы.Тем не менее, у меня также есть проблемы с этим, и мне было трудно найти документацию, касающуюся моей проблемы.

Вот команда wget, которую я пытаюсь выполнить:

>wget --no-check-certificate --certificate=www.washington.edu.crt https://www.washington.edu/cec/i/INFO200A2821.html

Вот что возвращает эта команда:

SYSTEM_WGETRC = c:/progra~1/wget/etc/wgetrc
syswgetrc = c:/progra~1/wget/etc/wgetrc
--2011-05-28 00:32:37--  https://www.washington.edu/cec/i/INFO200A2821.html
Resolving www.washington.edu... 140.142.16.69, 140.142.11.167, 140.142.15.8
Connecting to www.washington.edu|140.142.16.69|:443... connected.
WARNING: cannot verify www.washington.edu's certificate, issued by `/C=ZA/ST=Wes
tern Cape/L=Cape Town/O=Thawte Consulting cc/OU=Certification Services Division/
CN=Thawte Premium Server CA/emailAddress=premium-server@thawte.com':
  Self-signed certificate encountered.
HTTP request sent, awaiting response... 200 OK
Length: 807 [text/html]
Saving to: `INFO200A2821.html.2'

100%[=====================================> ] 807         --.-K/s   in 0s

2011-05-28 00:32:38 (6.78 MB/s) - `INFO200A2821.html.2' saved [807/807]

Однако, хотя я получаю страницу, он не содержит информацию, которую я надеюсь очистить.Страница, которая возвращает страницу, содержит форму, которая автоматически отправляет форму при загрузке.Форма содержит скрытые поля ввода для pubcookie и relay_url.

Я могу получить доступ к странице при входе в систему с моими учетными данными.Однако я изо всех сил пытаюсь автоматизировать это и собирать информацию.

1 Ответ

1 голос
/ 07 июля 2011

Я не уверен, что вы можете сделать это с помощью wget. Shibboleth - это реализация веб-профиля единого входа SAML, и он ожидает, что у вас будет действительный сеанс для доступа к защищенному ресурсу. Без действительного сеанса он перенаправит вас на страницу WAIF, чтобы вы могли выбрать подходящего поставщика удостоверений. Чтобы получить доступ к ресурсу, необходимо выполнить ряд шагов.

Вы можете попробовать использовать что-то вроде Mechanize.pm для Perl, чтобы автоматизировать процедуру аутентификации и затем получить защищенный ресурс.

...