Вы можете использовать для этого Регулярные выражения (RegEx).
Этот RegEx будет перехватывать все URL, начинающиеся с http и заключенные в кавычки ( "):
http([^\"]+)
А вот как это делается в Python:
import re
myRegEx = re.compile("http([^\"]+)")
myResults = MyRegEx.search('<source>')
Замените на переменную, хранящую исходный код, который вы хотите найти по URL.
myResults.start () и myResults.end () теперь содержат начальную и конечную позиции URL-адресов. Используйте функцию myResults.group () , чтобы найти строку, которая соответствует RegEx.
Если что-то еще не ясно, просто спросите.