Учитывая, что следующая строка встроена в текст, как я могу извлечь всю строку, но не совпадая по внутренним "<" и ">"?
<test type="yippie<innertext>" />
EDIT :
Чтобы быть более конкретным, нам нужно рассмотреть оба нижеприведенных варианта использования, в которых «type» имеет или не имеет символов «<» и «>».
<h:test type="yippie<innertext>" />
<h:test type="yippie">
Group 1: 'h:test'
Group 2: ' type="yippie<innertext>" ' -or- ' type="yippie"' (ie, remaining content before ">" or "/>")
Пока что у меня есть что-то подобное, но немного не так, как группа 2 останавливается на первом ">". Настройка первой части состояния группы 2.
(<([a-zA-Z0-9_:-]+)([^>"]*|[^>]*?)\s*(/)?>)
Спасибо за вашу помощь.