Question

Привет, ребята, я действительно пытаюсь понять регулярные выражения при очистке сайта, я использовал его в своем коде достаточно, чтобы вытащить следующее, но я застрял здесь.Мне нужно быстро схватить это:

http://www.example.com/online/store/TitleDetail?detail&sku=123456789

от этого:

('<a href="javascript:if(handleDoubleClick(this.id)){window.location=\'http://www.example.com/online/store/TitleDetail?detail&sku=123456789\';}" id="getTitleDetails_123456789">\r\n\t\t\t            \tcheck store inventory\r\n\t\t\t            </a>', 1)

Вот где я запутался.есть идеи?

Редактировать: номер артикула меняется в зависимости от продукта, поэтому в этом проблема для меня

arthurprs · Answer 1 · 20 мая 2010

http://www\.example\.com/online/store/TitleDetail\?detail&sku=\d+

используйте группу \ d с "Greedy" +, чтобы квалифицировать любое целочисленное значение в поле sku

themissinglint · Answer 2 · 20 мая 2010

, если всегда есть 9 цифр

http://www.example.com/online/store/TitleDetail?detail&sku=[0-9]{9}

при наличии произвольного числа цифр:

http://www.example.com/online/store/TitleDetail?detail&sku=[0-9]*

более общий:

http*?sku=[0-9]*

(«in *» означает, что сначала он найдет более короткие совпадения, поэтому вероятность найти совпадение с несколькими URL-адресами будет меньше)

изменить: [0-9]. не [1-9]

Matthew Flaschen · Answer 3 · 20 мая 2010

pattern = re.compile(r"window.location=\\'([^\\]*)")
haystack = r"""<a href="javascript:if(handleDoubleClick(this.id)){window.location=\'http://www.example.com/online/store/TitleDetail?detail&sku=123456789\';}" id="getTitleDetails_123456789">\r\n\t\t\t\tcheck store inventory\r\n\t\t\t</a>"""
url = re.search(pattern, haystack).group(1)

cryo · Answer 4 · 20 мая 2010

Для этого вам не нужны регулярные выражения, просто используйте строковые методы:

result = html[0].split("window.location='")[1].split("'")[0]

Как использовать регулярные выражения для вытягивания подстроки? (скребок экрана)

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 5 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как использовать регулярные выражения для вытягивания подстроки? (скребок экрана)

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 5 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы