У меня есть строка, автоматически сгенерированная сторонним веб-сервисом, где я хочу получить URL-адрес из строки. Строка выглядит так:
'document.write("<div class=\"display_archive\"><div class=\"campaign\">20\/12\/2011 - <a href=\"http:\/\/us2.campaign-archive1.com\/?u=fdf89fgd7sdf7d8&id=ffd89dfef3\" title=\"News\" target=\"_blank\">News<\/a><\/div><\/div>");'
Я хочу получить URL-адрес, в приведенном выше случае этот URL-адрес: http://us2.campaign -archive1.com /? U = fdf89fgd7sdf7d8 & id = ffd89dfef3 \ и я хочу удалить escape-обратную косую черту, поэтому URL-адрес: http://us2.campaign - archive1.com/?u=fdf89fgd7sdf7d8&id=ffd89dfef3/
Я пробовал использовать несколько разных анализаторов и Regex, но я не так силен в Regex и, похоже, не могу правильно получить URL. Я попробовал этот preg_match, но он не работает и возвращает только пустые массивы:
%^((http?://)|(www\.))([a-z0-9-].?)+(:[0-9]+)?(/.*)?$%i
Любая помощь очень ценится.
Искренняя
- Местика