cURL в PHP не получает ответ - PullRequest
1 голос
/ 20 декабря 2011

Я пытаюсь загрузить страницу с другого сайта на PHP, чтобы я мог очистить ее содержимое.Это работает практически с любой другой веб-страницей, но по какой-то причине не работает с этой:

http://www.bkstr.com/webapp/wcs/stores/servlet/CourseMaterialsResultsView?catalogId=10001&categoryId=9604&storeId=10161&langId=-1&programId=562&termId=100022286&divisionDisplayName=Stanford&departmentDisplayName=CS&courseDisplayName=103&sectionDisplayName=01

Кто-нибудь знает почему?Это брандмауэр или что-то?Или знаете другой способ сделать это?Даже на другом языке?

Вот код cURL, который я использую:

$ch = curl_init();
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_URL, $theurl);
$response = curl_exec($ch);
curl_close($ch);

Я пробовал следующие варианты cURL:

curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true); 
curl_setopt($ch, CURLOPT_TIMEOUT, 5);
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false); 
curl_setopt($ch, CURLOPT_PORT , *ports 22 and 433*);

** Знайте окакие-нибудь другие порты попробовать?Или способ выяснить, какой порт использует хост?Я пытаюсь зациклить возможные порты прямо сейчас.

Я попытался получить информацию, и вот что у меня есть:

$info = curl_getinfo($ch);
print_r($info);

возвращает

Array ( [url] => http://www.bkstr.com/webapp/wcs/stores/servlet/CourseMaterialsResultsView?catalogId=10001&categoryId=9604&storeId=10161&langId=-1&programId=562&termId=100022286&divisionDisplayName=Stanford&departmentDisplayName=CS&courseDisplayName=103§ionDisplayName=01 [content_type] => [http_code] => 0 [header_size] => 0 [request_size] => 289 [filetime] => -1 [ssl_verify_result] => 0 [redirect_count] => 0 [total_time] => 0.602861 [namelookup_time] => 0.226121 [connect_time] => 0.285047 [pretransfer_time] => 0.285149 [size_upload] => 0 [size_download] => 0 [speed_download] => 0 [speed_upload] => 0 [download_content_length] => 0 [upload_content_length] => 0 [starttransfer_time] => 0.602824 [redirect_time] => 0 )

Спасибо большое!

1 Ответ

0 голосов
/ 11 июля 2014

Теперь я понимаю, что веб-администраторы не должны включать CORS. Чтобы очистить страницу, я написал бота Java, который загрузил страницу в браузер и сохранил ее в файл. Грязно, но в конечном итоге это сработало ...

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...