Question

Я хочу создать образовательную поисковую систему в своем веб-приложении, поэтому я решил отсканировать около 10 веб-сайтов, используя PHP, с моей веб-страницы и сохранить данные в моей базе данных для последующего поиска.Как мне получить эти данные и сохранить их в моей базе данных?

c0mm0n · Answer 1 · 07 мая 2011

Создание сканера Я бы составил список URL-адресов, чтобы получить и, наконец, получить их

A.Составьте список

Определите список URL для сканирования
Добавьте этот URL в список URL для сканирования (список заданий)
Определитемаксимальная глубина
Разобрать первую страницу, получить все, найти ссылку, получить ссылку.
Для каждой ссылки: если она из того же домена или родственника, добавьте ее в список вакансий.
Удалить текущий URL из списка заданий,
Перезапустить из списка заданий следующего URL, если он не пустой.

Для этого вы можете использовать этот класс, который делаетпарсинг html действительно прост: http://simplehtmldom.sourceforge.net/

B.Получить содержимое

Цикл созданного массива и получение содержимого.file_get_contents сделает это за вас: http://www.php.net/manual/fr/function.file-get-contents.php

Это просто в принципе верно для начала, на шаге A вы должны сохранить список уже проанализированных URL, чтобы проверить их только один.Строка запроса также может быть чем-то, за чем вы будете следить, чтобы избежать сканирования нескольких страниц с другой строкой запроса.

Edgar Villegas Alvarado · Answer 2 · 07 мая 2011

Вы можете получить их с помощью функции file_get_contents(). Таким образом, у вас есть

$homepage = file_get_contents('http://www.example.com/homepage');

Эта функция возвращает страницу в строку.

Надеюсь, это поможет. Приветствия

Как хранить сканированные данные с веб-страниц

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как хранить сканированные данные с веб-страниц

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов