У меня проблемы с этим регулярным выражением, и я думаю, что я почти на месте.
m =re.findall('[a-z]{6}\.[a-z]{3}\.[a-z]{2} (?=\" target)', 'http://domain.com.uy " target')
Это дает мне "точный" вывод, который я хочу.это domain.com.uy
, но, очевидно, это всего лишь пример, поскольку [a-z]{6}
просто соответствует предыдущим 6 символам, и это не то, что я хочу.
Я хочу, чтобы он возвращал domain.com.uy
, поэтому в основном инструкция будет соответствует любому символу до "/" (назад).
Редактировать:
m =re.findall('\w+\.[a-z]{3}\.[a-z]{2} (?=\" target)', 'http://domain.com.uy " target')
Очень близко к тому, что я хочу, но не будет соответствовать "_" или"-".
Ради полноты я не нуждаюсь в http://
Надеюсь, вопрос достаточно ясен, если я оставлю что-нибудь открытое для интерпретациипожалуйста, попросите разъяснений!
Спасибо заранее!