Я внедрил веб-сканер, который сканирует и получает контент из домена верхнего уровня .edu. Содержание HTML вставляется в таблицы MySQL в качестве исходного кода страницы. Сценарий может продолжаться часами при нормальном подключении к Интернету, когда на сканер подается большое количество исходных URL. Теперь моя проблема в том, что скрипт останавливается после сканирования нескольких ссылок без каких-либо ошибок. Я использовал обработку исключений для обработки «MySQL Server пропал ошибки» и уже устранил много проблем и реализовал, если условия, которые повторяют ошибки, если они встречаются. Однако я не получаю никаких ошибок. Проблема заключается в остановке скрипта, независимо от того, запускаю ли я его в браузере, Eclipse PDT или CLI. Хотя стоит отметить, что количество просканированных ссылок несколько отличается во всех трех методах запуска скрипта. Я изменил php.ini max_execution_time и другие директивы, но это никак не помогает.
Я закодировал скрипт так, чтобы он возобновил сканирование с того места, где он остановился, но я хочу, чтобы скрипт продолжал без остановки, чтобы мне не приходилось отслеживать, работает скрипт или нет.
Должен ли я внести изменения в мои файлы Apache httpd.conf. Если да, то какими должны быть эти настройки ??
Может помочь описание в этих ссылках для моего веб-сканера.
Это код, который извлекает html из URL. Это из simple_html_dom.
[01-Jan-2012 22:54:39] Предупреждение PHP: file_get_contents () [streams.crypto]: этот поток не
поддержка SSL / шифрование в
D: \ wamp \ www \ crawler1 \ simplehtmldom_1_5 \ simple_html_dom.php в строке 72
[01.01.2012 22:54:39] Предупреждение PHP:
file_get_contents (http://lms.nust.edu.pk) [function.file-get-contents]:
не удалось открыть поток: невозможно подключиться к серверу HTTPS через прокси-сервер в
D: \ wamp \ www \ crawler1 \ simplehtmldom_1_5 \ simple_html_dom.php в строке 72
[01 января 2012 г. 22:54:41] Предупреждение PHP:
file_get_contents (http://www.nust.edu.pk/#) [function.file-get-contents]:
не удалось открыть поток: HTTP-запрос не выполнен! HTTP / 1.1 400 неверный запрос
в D: \ wamp \ www \ crawler1 \ simplehtmldom_1_5 \ simple_html_dom.php на линии
72
... (одна и та же ошибка повторяется дважды) ...
[01 января 2012 г. 22:55:58] Предупреждение PHP:
file_get_contents (http://www.nust.edu.pk/usr/oricdic.aspx#ipo) [function.file-get-contents]:
не удалось открыть поток: HTTP-запрос не выполнен! HTTP / 1.1 400 неверный запрос
в D: \ wamp \ www \ crawler1 \ simplehtmldom_1_5 \ simple_html_dom.php на линии
72
[01 января 2012 г. 22:55:58] Предупреждение PHP:
file_get_contents (http://www.nust.edu.pk/usr/oricdic.aspx#tto) [function.file-get-contents]:
не удалось открыть поток: HTTP-запрос не выполнен! HTTP / 1.1 400 неверный запрос
в D: \ wamp \ www \ crawler1 \ simplehtmldom_1_5 \ simple_html_dom.php на линии
72
[01.01.2012 22:55:59] Предупреждение PHP:
file_get_contents (http://www.nust.edu.pk/usr/oricdic.aspx#ilo) [function.file-get-contents]:
не удалось открыть поток: HTTP-запрос не выполнен! HTTP / 1.1 400 неверный запрос
в D: \ wamp \ www \ crawler1 \ simplehtmldom_1_5 \ simple_html_dom.php на линии
72
[01 января 2012 г. 22:55:59] Предупреждение PHP:
file_get_contents (http://www.nust.edu.pk/usr/oricdic.aspx#mco) [function.file-get-contents]:
не удалось открыть поток: HTTP-запрос не выполнен! HTTP / 1.1 400 неверный запрос
в D: \ wamp \ www \ crawler1 \ simplehtmldom_1_5 \ simple_html_dom.php на линии
72
[01 января 2012 г. 22:56:05] Предупреждение PHP:
file_get_contents (http://www.nust.edu.pk/#) [function.file-get-contents]:не удалось открыть поток: HTTP-запрос не выполнен! HTTP / 1.1 400 неверный запрос
в D: \ wamp \ www \ crawler1 \ simplehtmldom_1_5 \ simple_html_dom.php на линии
72
... (та же ошибка повторяется 18 раз) ...
[01.01.2012 22:57:33] Предупреждение PHP:
file_get_contents (http://www.nust.edu.pk/#ctl00_SiteMapPath1_SkipLink)
[function.file-получить содержание]:
не удалось открыть поток: HTTP-запрос не выполнен! HTTP / 1.1 400 неверный запрос
в D: \ wamp \ www \ crawler1 \ simplehtmldom_1_5 \ simple_html_dom.php на линии
72
[01.01.2012 22:57:33] Примечание PHP: Неопределенная переменная: части в
D: \ wamp \ www \ crawler1 \ AbsoluteUrl \ url_to_absolute.php в строке 330
[01.01.2012 22:57:55] Предупреждение PHP:
file_get_contents (http://www.harvard.edu/#skip) [function.file-get-contents]:
не удалось открыть поток: HTTP-запрос не выполнен! HTTP / 1.1 404 Не найдено
в D: \ wamp \ www \ crawler1 \ simplehtmldom_1_5 \ simple_html_dom.php на линии
72
[01 января 2012 г. 22:58:21] Предупреждение PHP:
file_get_contents (http://www.harvard.edu/admissions-aid#undergrad) [function.file-get-contents]:
не удалось открыть поток: HTTP-запрос не выполнен! HTTP / 1.1 404 Не найдено
в D: \ wamp \ www \ crawler1 \ simplehtmldom_1_5 \ simple_html_dom.php на линии
72
[01.01.2012 22:58:22] Предупреждение PHP:
file_get_contents (http://www.harvard.edu/admissions-aid#grad) [function.file-get-contents]:
не удалось открыть поток: HTTP-запрос не выполнен! HTTP / 1.1 404 Не найдено
в D: \ wamp \ www \ crawler1 \ simplehtmldom_1_5 \ simple_html_dom.php на линии
72
[01 января 2012 г. 22:58:24] Предупреждение PHP:
file_get_contents (http://www.harvard.edu/admissions-aid#continue) [function.file-get-contents]:
не удалось открыть поток: HTTP-запрос не выполнен! HTTP / 1.1 404 Не найдено
в D: \ wamp \ www \ crawler1 \ simplehtmldom_1_5 \ simple_html_dom.php на линии
72
[01.01.2012 22:58:25] Предупреждение PHP:
file_get_contents (http://www.harvard.edu/admissions-aid#summer) [function.file-get-contents]:
не удалось открыть поток: HTTP-запрос не выполнен! HTTP / 1.1 404 Не найдено
в D: \ wamp \ www \ crawler1 \ simplehtmldom_1_5 \ simple_html_dom.php на линии
72
[01 января 2012 г. 23:00:04] Предупреждение PHP:
file_get_contents (http://www.harvard.edu/#) [function.file-get-contents]:
не удалось открыть поток: HTTP-запрос не выполнен! HTTP / 1.1 404 Не найдено
в D: \ wamp \ www \ crawler1 \ simplehtmldom_1_5 \ simple_html_dom.php на линии
72
... (та же ошибка повторяется 1 раз) ...
[01 января 2012 г. 23:00:11] Примечание по PHP: неопределенная переменная: части в
D: \ wamp \ www \ crawler1 \ AbsoluteUrl \ url_to_absolute.php в строке 330
[01 января 2012 г. 23:00:41] Предупреждение PHP: file_get_contents () [streams.crypto]: этот поток не
поддержка SSL / шифрование в
D: \ wamp \ www \ crawler1 \ simplehtmldom_1_5 \ simple_html_dom.php в строке 72
[01 января 2012 г. 23:00:41] Предупреждение PHP:
file_get_contents (http://directory.berkeley.edu) [function.file-get-contents]:
не удалось открыть поток: невозможно подключиться к серверу HTTPS через прокси-сервер в
D: \ wamp \ www \ crawler1 \ simplehtmldom_1_5 \ simple_html_dom.php в строке 72
[01 января 2012 г. 23:00:47] Примечание PHP: Неопределенная переменная: части в
D: \ wamp \ www \ crawler1 \ AbsoluteUrl \ url_to_absolute.php в строке 330
[01 января 2012 г. 23:01:53] Предупреждение PHP: file_get_contents () [streams.crypto]: этот поток не
поддержка SSL / шифрование в
D: \ wamp \ www \ crawler1 \ simplehtmldom_1_5 \ simple_html_dom.php в строке 72
[01.01.2012 23:01:53] Предупреждение PHP:
file_get_contents (http://students.berkeley.edu/uga/) [function.file-get-contents]:
не удалось открыть поток: невозможно подключиться к серверу HTTPS через прокси-сервер в
D: \ wamp \ www \ crawler1 \ simplehtmldom_1_5 \ simple_html_dom.php в строке 72
[01 января 2012 г. 23:01:57] Предупреждение PHP: file_get_contents () [streams.crypto]: этот поток не
поддержка SSL / шифрование в
D: \ wamp \ www \ crawler1 \ simplehtmldom_1_5 \ simple_html_dom.php в строке 72
[01.01.2012 23:01:57] Предупреждение PHP:
file_get_contents (http://publicservice.berkeley.edu/) [function.file-get-contents]:Не удалось открыть поток: не удается подключиться к HTTPS-серверу через прокси-сервер в D: \ wamp \ www \ crawler1 \ simplehtmldom_1_5 \ simple_html_dom.php в строке 72
[01-Jan-2012 23:02:00] Предупреждение PHP: file_get_contents () [streams.crypto]: этот поток не поддерживает SSL / шифрование в D: \ wamp \ www \ crawler1 \ simplehtmldom_1_5 \ simple_html_dom.php в строке 72
[01 января 2012 г. 23:02:00] Предупреждение PHP: file_get_contents (http://students.berkeley.edu/osl/leadprogs.asp) [function.file-get-contents]: не удалось открыть поток: невозможно подключиться к HTTPS-серверу через прокси в D: \ wamp \ www \ crawler1 \ simplehtmldom_1_5 \ simple_html_dom.php в строке 72
[01-Jan-2012 23:02:17] Примечание PHP: Неопределенная переменная: части в D: \ wamp \ www \ crawler1 \ AbsoluteUrl \ url_to_absolute.php в строке 330
[01-Jan-2012 23:02:25] Предупреждение PHP: file_get_contents () [streams.crypto]: этот поток не поддерживает SSL / шифрование в D: \ wamp \ www \ crawler1 \ simplehtmldom_1_5 \ simple_html_dom.php on line 72
[01.01.2012 23:02:25] Предупреждение PHP: file_get_contents (http://bearfacts.berkeley.edu/bearfacts) [function.file-get-contents]: не удалось открыть поток: невозможно подключиться к HTTPS-серверу через прокси-сервер в D: \ wamp \ www \ crawler1 \ simplehtmldom_1_5 \ simple_html_dom.php в строке 72
[01 января 2012 г. 23:02:28] Предупреждение PHP: file_get_contents () [streams.crypto]: этот поток не поддерживает SSL / шифрование в D: \ wamp \ www \ crawler1 \ simplehtmldom_1_5 \ simple_html_dom.php на линии72
[01.01.2012 23:02:28] PHP Предупреждение: file_get_contents (http://career.berkeley.edu/) [function.file-get-contents]: не удалось открыть поток: невозможно подключиться к серверу HTTPSчерез прокси в D: \ wamp \ www \ crawler1 \ simplehtmldom_1_5 \ simple_html_dom.php в строке 72
Пожалуйста, помогите мне в этом отношении.