В настоящее время я играю с дампами данных переполнения стека и пытаюсь создать (как я себе представляю) простое регулярное выражение для извлечения имен тегов из символов <
и >
. Итак, для каждого вопроса у меня есть список из одного или нескольких тегов, таких как <tagone><tag-two>...<tag-n>
, и я пытаюсь извлечь только список имен тегов. Вот несколько примеров строк тегов, взятых из дампа данных:
<javascript><internet-explorer>
<c#><windows><best-practices><winforms><windows-services>
<c><algorithm><sorting><word>
<java>
Для справки, мне не нужно делить имена тегов на слова, поэтому для примеров вроде <best-practices>
я бы хотел получить best-practices
(не best
и practices
) , Кроме того, что бы это ни стоило, я использую Python, если это имеет какое-то значение. Есть предложения?