Question

У меня есть текст, в котором были использованы только  и . Например, abcd efg-123. Можно ли извлечь строку между этими тегами? также мне нужно извлечь 3 слова до и после этого фрагмента строки abcd efg-123. Как я могу это сделать? что было бы подходящим регулярным выражением для этого?

ghostdog74 · Answer 1 · 20 октября 2010

получит то, что находится между тегами,

>>> s="1 2 3<b>abcd efg-123</b>one two three"
>>> for i in s.split("</b>"):
...   if "<b>" in i:
...      print i.split("<b>")[-1]
...
abcd efg-123

driax · Answer 2 · 20 октября 2010

Обрабатывает теги внутри , если они не являются  ofcouse.

import re    
sometext = 'blah blah 1 2 3<b>abcd efg-123</b>word word2 word3 blah blah'
result = re.findall(
      r'(((?:(?:^|\s)+\w+){3}\s*)'            # Match 3 words before
      r'<b>([^<]*|<[^/]|</[^b]|</b[^>])</b>'  # Match <b>...</b>
      r'(\s*(?:\w+(?:\s+|$)){3}))', sometext) # Match 3 words after

result == [(' 1 2 3<b>abcd efg-123</b>word word2 word3 ',
    ' 1 2 3',
    'abcd efg-123',
    'word word2 word3 ')]

Это должно работать и работать хорошо, но если оно становится более продвинутым, тогда вы должны рассмотреть использование HTMLсинтаксический анализатор.

eric_arthur_blair · Answer 3 · 20 октября 2010

Это на самом деле очень тупая версия и не допускает вложенные теги.

re.search(r"(\w+)\s+(\w+)\s+(\w+)\s+<b>([^<]+)</b>\s+(\w+)\s+(\w+)\s+(\w+)", text)

См. Документацию по Python .

Joshua Fox · Answer 4 · 20 октября 2010

Вы не должны использовать регулярные выражения для разбора HTML. Так лежит безумие.

Вышеуказанная статья фактически предоставляет регулярное выражение для вашей проблемы, но не используйте его.

Поиск строк в тексте с использованием регулярных выражений с Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Поиск строк в тексте с использованием регулярных выражений с Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов