Question

Я скачал последнюю версию phpcrawler и могу получить доступ к своему собственному тестовому веб-сайту.

У меня есть только изображение и текст на этом сайте, я запускаю сканер и получаютекст без изображения, потому что я правильно выполнил $crawler->addNonFollowMatch("/.(jpg|gif|png)$/ i");

Я не могу его сохранить, чтобы сохранить файл tmp Он не сохраняет уникальный файл tmp в папкеЯ запустил сканер, я попытался сохранить именованный файл, не повезло.

Я столкнулся с множеством устаревших ошибок в разных строках всех файлов php, например: @fopen, @ вызывает проблемы в разных областях.Я использую PHP, а также могу сделать Regex.Дэвид.

Paul Prendiz · Answer 1 · 05 апреля 2012

Я ответил на свой вопрос, так как вижу, что PHPCrawler вопросы действительно не получают ответа;Я видел вопрос с прошлого года без ответа.Я также отвечу на это, хотя может быть слишком поздно, чтобы сделать что-нибудь хорошее.Это ответ.

Я добавил в модифицированный phpcrawler, который я настроил для своих нужд:

$fp = fopen('c:/test/poopoo.txt','w');
fwrite($fp,($page_data['source'])); 
fclose($fp);

Вы помещаете его перед сбросом файла и создаете свой экземпляр класса.1008 * Я узнал, используя PHP Simple HTML DOM Parser из , этот проект работает хорошо.Если вам нужно больше контроля, используйте RegExp, но у этого есть крутая кривая обучения.

PHPcrawler - файл tmp

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

PHPcrawler - файл tmp

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы