Вы можете использовать регулярное выражение (регулярное выражение), чтобы просмотреть источник страницы и проанализировать все теги IMG.
Это регулярное выражение выполнит эту работу довольно хорошо: <img[^>]+src="(.*?)"
Как это работает?
// <img[^>]+src="(.*?)"
//
// Match the characters "<img" literally «<img»
// Match any character that is not a ">" «[^>]+»
// Between one and unlimited times, as many times as possible, giving back as needed (greedy) «+»
// Match the characters "src="" literally «src="»
// Match the regular expression below and capture its match into backreference number 1 «(.*?)»
// Match any single character that is not a line break character «.*?»
// Between zero and unlimited times, as few times as possible, expanding as needed (lazy) «*?»
// Match the character """ literally «"»
Пример кода PHP:
preg_match_all('/<img[^>]+src="(.*?)"/i', $subject, $result, PREG_PATTERN_ORDER);
for ($i = 0; $i < count($result[0]); $i++) {
// image URL is in $result[0][$i];
}
Вам придется проделать немного больше работы, чтобы разрешить такие вещи, как относительные URL.