Я предполагаю, что вы хотите получить страницы, скрытые за страницей входа, и эта страница не защищена CAPTCHA. Для этого вам нужно
- отправить POST-запрос с данными формы входа на URL отправки формы входа (см. Источник HTML)
- сохранить куки
- отправить эти куки со всеми последующими запросами (при необходимости обновить)
Я делаю это с wget
. curl
должно быть похоже (см. Руководство).
1, 2:
wget --keep-session-cookies --save-cookies "mycookies" \
--post-data "login=mylogin&password=mypass" submit_URL
3
wget --load-cookies "mycookies" --keep-session-cookies --save-cookies "mycookies" \
another_URL_behind_login_form
Из того, что я вижу в man curl
, 1–2 должно быть примерно так (не проверено):
curl -F "login=mylogin;password=mypass" -c "mycookies" submit_URL
и 3:
curl -b "mycookies" -c "mycookies" another_URL
Но я не пробовал с curl
.