Я думаю, что это должно быть элементарно, но я все еще не могу разобраться с этим.Допустим, есть достаточное количество документов HTML, и мне нужно извлечь из них URL-адреса всех изображений.
Остальная часть содержимого изменяется, но база URL-адреса всегда одинакова, например: http://images.examplesite.com/images/
,
Итак, я хочу извлечь каждую строку, содержащую эту часть.проблема в том, что они всегда смешиваются с тегами <a href=''>
или <img src=''>
, так как я могу их исключить?preg_match
вероятно?