Как определить, является ли страница страницей входа? - PullRequest
0 голосов
/ 29 марта 2011

Я пишу скрипт PHP, который ищет и читает html-контент, используя cURL.

Я хочу определить из содержимого и / или заголовка ответа, требуется ли для входа на целевую страницу логин.

Я понимаю, что обычно при анонимном запросе страницы сервер перенаправляет на страницу входа в систему, если это необходимо. Поправь меня, если я ошибаюсь.

Я перечитал и получил несколько идей:

  1. поиск метатега refresh или когда код возврата http 302, затем проверьте, относится ли он к URI с &action=login (или аналогичным)
  2. поиск формы входа в теле эффективной страницы. (Я признаю, что на той же странице может быть контент И форма входа)

Являются ли эти методы действительными и насколько точны эти методы? Какие еще методы / признаки я могу использовать, чтобы идентифицировать / предложить страницу входа? Или это невыполнимая задача для достижения цели с точностью 60-70%?

Примечание : Я не пытаюсь разобраться, просто выясняю, требуется ли это для входа в систему.

Ниже приведены соответствующие параметры, просто для справки.

curl_setopt($ch, CURLOPT_HEADER, 1);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
curl_setopt($ch, CURLOPT_MAXREDIRS, 5);

Заранее спасибо

1 Ответ

2 голосов
/ 29 марта 2011

Найдите на целевой странице перенаправления форму с <input type='password'

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...