Ваш вопрос было очень трудно понять, но из приведенного примера вывода похоже, что вы хотите убрать все в пределах <
и >
из входного текста. Это можно сделать так:
import re
input_text = '<a bob>i <b>c</b></a>'
output_text = re.sub('<[^>]*>', '', input_text)
print output_text
Что дает вам:
i c
Если это не то, что вы хотите, уточните.
Обратите внимание, что подход регулярного выражения для разбора XML очень хрупок. Например, приведенный выше пример будет разбит на вход <a name="b>c">hey</a>
. (>
является допустимым символом в значении атрибута: см. Спецификации XML )