Замените URL ссылкой на регулярное выражение в python - PullRequest
3 голосов
/ 11 июля 2009

как мне преобразовать текст в ссылку? Вернувшись в PHP, я использовал этот фрагмент кода, который хорошо работал для моей цели:

            $text = preg_replace("#(^|[\n ])(([\w]+?://[\w\#$%&~.\-;:=,?@\[\]+]*)(/[\w\#$%&~/.\-;:=,?@\[\]+]*)?)#is", "\\1<a href=\"\\2\" target=\"_blank\">\\3</a>", $text);
            $text = preg_replace("#(^|[\n ])(((www|ftp)\.[\w\#$%&~.\-;:=,?@\[\]+]*)(/[\w\#$%&~/.\-;:=,?@\[\]+]*)?)#is", "\\1<a href=\"http://\\2\" target=\"_blank\">\\3</a>", $text);

Я пробовал в Python, но не смог заставить его работать .. Было бы очень хорошо, если бы кто-то мог перевести это на Python

1 Ответ

6 голосов
/ 11 июля 2009

Код ниже является простым переводом на python. Вы должны подтвердить, что он действительно делает то, что вы хотите. Для получения дополнительной информации, см. Python Regular Expression HOWTO .

import re

pat1 = re.compile(r"(^|[\n ])(([\w]+?://[\w\#$%&~.\-;:=,?@\[\]+]*)(/[\w\#$%&~/.\-;:=,?@\[\]+]*)?)", re.IGNORECASE | re.DOTALL)

pat2 = re.compile(r"#(^|[\n ])(((www|ftp)\.[\w\#$%&~.\-;:=,?@\[\]+]*)(/[\w\#$%&~/.\-;:=,?@\[\]+]*)?)", re.IGNORECASE | re.DOTALL)


urlstr = 'http://www.example.com/foo/bar.html'

urlstr = pat1.sub(r'\1<a href="\2" target="_blank">\3</a>', urlstr)
urlstr = pat2.sub(r'\1<a href="http:/\2" target="_blank">\3</a>', urlstr)

print urlstr

Вот как выглядит вывод на моем конце:

<a href="http://www.example.com/foo/bar.html" target="_blank">http://www.example.com</a>
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...