Я пишу скрипт PHP, который ищет и читает html-контент, используя cURL.
Я хочу определить из содержимого и / или заголовка ответа, требуется ли для входа на целевую страницу логин.
Я понимаю, что обычно при анонимном запросе страницы сервер перенаправляет на страницу входа в систему, если это необходимо. Поправь меня, если я ошибаюсь.
Я перечитал и получил несколько идей:
- поиск метатега
refresh
или когда код возврата http 302, затем проверьте, относится ли он к URI с &action=login
(или аналогичным)
- поиск формы входа в теле эффективной страницы. (Я признаю, что на той же странице может быть контент И форма входа)
Являются ли эти методы действительными и насколько точны эти методы? Какие еще методы / признаки я могу использовать, чтобы идентифицировать / предложить страницу входа? Или это невыполнимая задача для достижения цели с точностью 60-70%?
Примечание : Я не пытаюсь разобраться, просто выясняю, требуется ли это для входа в систему.
Ниже приведены соответствующие параметры, просто для справки.
curl_setopt($ch, CURLOPT_HEADER, 1);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
curl_setopt($ch, CURLOPT_MAXREDIRS, 5);
Заранее спасибо