преобразование URL, питона - PullRequest
0 голосов
/ 07 ноября 2010

У меня есть текстовый файл, который содержит некоторые URL:

[http://igu.org.ru/ International Geographical Union - Russian National Committee]
[http://www.geografos.org Colegio de Geógrafos - España]
[http://www.geografs.org Col.legi de Geògrafs - Catalunya]
[http://www.geografs.org]

Теперь я хочу преобразовать эти внешние ссылки следующим образом (в фиксированном порядке):

заменить "[url any text]" на "any text", где "url" - это URL-адрес (например, начинается с "http://").

)

заменить "[url]" на "url"

import re
def openfile(filename):
    with codecs.open(filename, encoding="utf-8") as F:
        replace = F.read()
        replace = re.sub(r'\[http://.+ ...) # should replace "[url any text]" with "any text"
        replace = re.sub(...) # should replace "[url]" with "url"

есть предложения?

1 Ответ

2 голосов
/ 07 ноября 2010
re1 = re.compile(r'\[(http[^\s]*)\s(.*)\]')
re2 = re.compile(r'\[(http[^\s]*)\]')
with codecs.open(filename, encoding='utf-8') as F:
    text = F.read()
    pre_filter = re1.sub('\g<2>', text)
    result = re2.sub('\g<1>', pre_filter)

для обработки вашего текста.Для получения дополнительной информации в фоновом режиме вы можете прочитать: http://docs.python.org/howto/regex.html#search-and-replace

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...