Я пытаюсь собрать информацию о DOMME (NOTAM) на этой форме через PHP.
Проблема в том, что веб-сайт использует перенаправление JavaScript для обработки запроса POST 2 раза (на ссылка 1 , затем на адрес формы (с помощью POST), затем перенаправляет пользователя на адрес формы снова (с помощью GET). ).
Я использовал расширение HTTP-заголовков Firefox Live для сбора журнала запросов и пытался подделать отправленные заголовки (по существу, Content-Type, Content-Length для POST и даже Accept и Referer, если они нестандартные).
Я использую метод PHP file_get_contents.
Вот код:
Первый запрос (POST)
<?php
// POST form fields definition
$donnees = array(
'bResultat' => 'true',
'bImpression' => '',
'ModeAffichage' => 'COMPLET',
'AERO_Date_DATE' => date("Y").'/'.date("m").'/'.date("d"),
'AERO_Date_HEURE' => date("H").':'.((date("i")+10 >= 60) ? 60-date("i")+10 : date("i")+10),
'AERO_Langue' => 'FR',
'AERO_Duree' => '12',
'AERO_CM_REGLE' => '1',
'AERO_CM_GPS' => '2',
'AERO_CM_INFO_COMP' => '1',
'AERO_Tab_Aero[0]' => 'LFQQ',
'AERO_Tab_Aero[1]' => '',
'AERO_Tab_Aero[2]' => '',
'AERO_Tab_Aero[3]' => '',
'AERO_Tab_Aero[4]' => '',
'AERO_Tab_Aero[5]' => '',
'AERO_Tab_Aero[6]' => '',
'AERO_Tab_Aero[7]' => '',
'AERO_Tab_Aero[8]' => '',
'AERO_Tab_Aero[9]' => '',
'AERO_Tab_Aero[10]' => '',
'AERO_Tab_Aero[11]' => ''
);
// Headers encoding function definition
function http_build_headers( $headers ) {
$headers_brut = '';
foreach( $headers as $nom => $valeur ) {
$headers_brut .= $nom . ': ' . $valeur . "\r\n";
}
return $headers_brut;
}
// Raw request content creation
$contenu = http_build_query( $donnees );
var_dump($contenu);
echo "<br/>=============<br/>";
// Headers definition
$headers = http_build_headers(
array(
'Referer' => 'http://notamweb.aviation-civile.gouv.fr/Script/IHM/Com_Chargement.php?URL=Bul_Aerodrome.php',
'Content-Type' => 'application/x-www-form-urlencoded',
'Content-Length' => strlen($contenu)
)
);
echo strlen($contenu)."<br />=============<br/>";
// Context definition
$options = array(
'http' => array(
'user_agent' => 'Mozilla/5.0 (Windows; U; Windows NT 6.1; fr; rv:1.9.2.13) Gecko/20101203 Firefox/3.6.13',
'method' => 'POST',
'content' => $contenu,
'header' => $headers
)
);
// Context creation
$contexte = stream_context_create( $options );
// Sends POST form
$retour = file_get_contents( 'http://notamweb.aviation-civile.gouv.fr/Script/IHM/Bul_Aerodrome.php?AERO_Langue=FR', false, $contexte );
Второй запрос (GET) следующий:
// Headers definition
$headers = http_build_headers(
array(
'Accept' => 'text/css,*/*;q=0.1',
'Referer' => 'http://notamweb.aviation-civile.gouv.fr/Script/IHM/Bul_Aerodrome.php?AERO_Langue=FR'
)
);
// Context definition
$options = array(
'http' => array(
'user_agent' => 'Mozilla/5.0 (Windows; U; Windows NT 6.1; fr; rv:1.9.2.13) Gecko/20101203 Firefox/3.6.13',
'method' => 'GET',
'header' => $headers
)
);
// Context creation
$contexte = stream_context_create( $options );
// Sends GET request
$retour = file_get_contents( 'http://notamweb.aviation-civile.gouv.fr/Script/IHM/Bul_Aerodrome.php?AERO_Langue=FR', false, $contexte );
var_dump($retour);
?>
Мне показалось, что мой вопрос очевиден: как PHP может обнаруживать и управлять такими перенаправлениями JavaScript? Есть ли хитрость, чтобы обойти их? Или каким-либо другим способом добиться этого?
Большое спасибо