Как обойти перенаправление JavaScript, получая контент через PHP GET / POST - PullRequest
0 голосов
/ 24 февраля 2011

Я пытаюсь собрать информацию о DOMME (NOTAM) на этой форме через PHP.

Проблема в том, что веб-сайт использует перенаправление JavaScript для обработки запроса POST 2 раза (на ссылка 1 , затем на адрес формы (с помощью POST), затем перенаправляет пользователя на адрес формы снова (с помощью GET). ).

Я использовал расширение HTTP-заголовков Firefox Live для сбора журнала запросов и пытался подделать отправленные заголовки (по существу, Content-Type, Content-Length для POST и даже Accept и Referer, если они нестандартные).

Я использую метод PHP file_get_contents.

Вот код:

Первый запрос (POST)

<?php
// POST form fields definition
$donnees = array(
'bResultat' => 'true',
'bImpression' => '',
'ModeAffichage' => 'COMPLET',
'AERO_Date_DATE' => date("Y").'/'.date("m").'/'.date("d"),
'AERO_Date_HEURE' => date("H").':'.((date("i")+10 >= 60) ? 60-date("i")+10 : date("i")+10),
'AERO_Langue' => 'FR',
'AERO_Duree' => '12',
'AERO_CM_REGLE' => '1',
'AERO_CM_GPS' => '2',
'AERO_CM_INFO_COMP' => '1',
'AERO_Tab_Aero[0]' => 'LFQQ',
'AERO_Tab_Aero[1]' => '',
'AERO_Tab_Aero[2]' => '',
'AERO_Tab_Aero[3]' => '',
'AERO_Tab_Aero[4]' => '',
'AERO_Tab_Aero[5]' => '',
'AERO_Tab_Aero[6]' => '',
'AERO_Tab_Aero[7]' => '',
'AERO_Tab_Aero[8]' => '',
'AERO_Tab_Aero[9]' => '',
'AERO_Tab_Aero[10]' => '',
'AERO_Tab_Aero[11]' => ''
);


// Headers encoding function definition
function http_build_headers( $headers ) {

       $headers_brut = '';

       foreach( $headers as $nom => $valeur ) {
               $headers_brut .= $nom . ': ' . $valeur . "\r\n";
       }

       return $headers_brut;
}

// Raw request content creation
$contenu = http_build_query( $donnees );
var_dump($contenu);
echo "<br/>=============<br/>";

// Headers definition
$headers = http_build_headers(
    array(
        'Referer' => 'http://notamweb.aviation-civile.gouv.fr/Script/IHM/Com_Chargement.php?URL=Bul_Aerodrome.php',
        'Content-Type' => 'application/x-www-form-urlencoded',
        'Content-Length' => strlen($contenu)
    )
);
echo strlen($contenu)."<br />=============<br/>";

// Context definition
$options = array(
    'http' => array(
        'user_agent' => 'Mozilla/5.0 (Windows; U; Windows NT 6.1; fr; rv:1.9.2.13) Gecko/20101203 Firefox/3.6.13',
        'method' => 'POST',
        'content' => $contenu,
        'header' => $headers
    )
);

// Context creation
$contexte = stream_context_create( $options );

// Sends POST form
$retour = file_get_contents( 'http://notamweb.aviation-civile.gouv.fr/Script/IHM/Bul_Aerodrome.php?AERO_Langue=FR', false, $contexte );

Второй запрос (GET) следующий:

// Headers definition
$headers = http_build_headers(
    array(
        'Accept' => 'text/css,*/*;q=0.1',
        'Referer' => 'http://notamweb.aviation-civile.gouv.fr/Script/IHM/Bul_Aerodrome.php?AERO_Langue=FR'
    )
);

// Context definition
$options = array(
    'http' => array(
        'user_agent' => 'Mozilla/5.0 (Windows; U; Windows NT 6.1; fr; rv:1.9.2.13) Gecko/20101203 Firefox/3.6.13',
        'method' => 'GET',
        'header' => $headers
    )
);

// Context creation
$contexte = stream_context_create( $options );

// Sends GET request
$retour = file_get_contents( 'http://notamweb.aviation-civile.gouv.fr/Script/IHM/Bul_Aerodrome.php?AERO_Langue=FR', false, $contexte );

var_dump($retour);
?>

Мне показалось, что мой вопрос очевиден: как PHP может обнаруживать и управлять такими перенаправлениями JavaScript? Есть ли хитрость, чтобы обойти их? Или каким-либо другим способом добиться этого?

Большое спасибо

1 Ответ

0 голосов
/ 18 ноября 2011

Ответ прост: Php не может обнаружить и управлять перенаправлениями JavaScript на всех .

Вы должны будете понять, что JavaScript делает на странице, и написать некоторый код Php, который «имитирует» то, что сделал бы JavaScript (в вашем случае вроде «угадайте», что есть перенаправление, и сделайте другое file_get_contents()) .

...