Question

У меня есть следующий текст HTML:

Country/<i>List it here</i><br><font color="#ff00ff">Dubai</font><br><br>

Как извлечь «Дубай» из приведенного выше HTML? У меня есть несколько сотен таких строк, довольно срочных, поэтому я не исследую реализацию BeautifulSoup или парсера XML.

Большое спасибо!

Laurence Gonsalves · Answer 1 · 03 ноября 2010

Поскольку вам просто нужно что-то быстрое и грязное, вы можете использовать:

re.match(r'.*>([^<>]*)</font>.*', s).group(1)

Это просто захватывает все вещи, не относящиеся к углам, перед закрывающим тегом шрифта.Опять же, не подходит для «настоящего» разбора.

Пожалуйста, помогите извлечь текст из тегов HTML с помощью Python Regex

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, помогите извлечь текст из тегов HTML с помощью Python Regex

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов