Реплицируйте предложения Digg по изображению из представленного URL с помощью PHP - PullRequest
1 голос
/ 06 июня 2009

Поэтому я ищу идеи о том, как наилучшим образом воспроизвести функциональность, замеченную в digg. По сути, вы отправляете URL интересующей вас страницы, затем digg сканирует DOM, чтобы найти все теги IMG (вероятно, выбирая только несколько из них выше определенной высоты / ширины), а затем создает из них миниатюру и спрашивает, какие Вы хотели бы представить свою заявку.

Несмотря на то, что там много чего происходит, меня больше всего интересует лучший способ получения изображений с представленной страницы.

Ответы [ 3 ]

1 голос
/ 06 июня 2009

Хотя вы можете попытаться разобрать веб-страницу, HTML может быть настолько беспорядочным, что вам лучше всего с чем-то близким, но несовершенным.

  1. Извлеките все, что похоже на ссылку на тег изображения.
  2. Попробуйте получить URL
  3. Проверьте, вернули ли вы изображение

Просто поиск и захват содержимого src = "..." приведет вас туда. Некоторые базовые манипуляции для работы с относительными и абсолютными ссылками на изображения, и вы здесь.

Очевидно, что каждый раз, когда вы запрашиваете веб-ресурс по требованию третьей стороны, вам необходимо следить за тем, чтобы вас не оскорбляли.

0 голосов
/ 06 июня 2009

Вы также можете использовать PHP Simple HTML DOM Parser , который поможет вам искать все теги изображений.

0 голосов
/ 06 июня 2009

Я предлагаю cURL + регулярное выражение.

...