Question

вопрос о регулярном выражении python.

Я бы хотел сопоставить блок div как

<div class="leftTail"><ul class="hotnews">any news stuff</ul></div>

Я думал о шаблоне как

p = re.compile(r'<div\s+class=\"leftTail\">[^(div)]+</div>')

но, похоже, он не работает должным образом

другая модель

p = re.compile(r'<div\s+class=\"leftTail\">[\W|\w]+</div>')

Я получил гораздо больше, чем я думаю, он получает все до последнего тега в файле.

Спасибо за любую помощь

steveha · Answer 1 · 09 октября 2009

Возможно, вы захотите перейти к фактическому анализатору HTML. Я предлагаю вам попробовать Beautiful Soup . Существует множество безумных способов форматирования HTML, и регулярные выражения могут работать не всегда правильно, даже если вы их правильно напишите.

Laurence Gonsalves · Answer 2 · 09 октября 2009

Не используйте регулярные выражения для разбора XML или HTML. Вы никогда не сможете заставить его работать правильно для вложенных div.

регулярное выражение python для разбора тегов div

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

регулярное выражение python для разбора тегов div

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов