Я пытаюсь извлечь определенные URL-адреса из HTML (например, все, которые начинаются с http, содержат / tempfiles / и заканчиваются на .jpg). У меня есть что-то вроде;
http.*?\/tempfiles\/.*?\.jpg
Проблема в том, когда у меня есть HTML как;
blah blah <img src=http://somelink/file.html>http://server/tempfiles/blah.jpg
blah blah
Возвращает http://somelink/file.html etc
more junk http://server/tempfiles/blah.jpg
Есть ли способ сказать, что не должно быть второго http между первым и / tempfiles /?