Действительно простое / базовое решение - использовать регулярные выражения в приведенной ниже форме для захвата каждой из ваших групп в отдельности.В основном он ищет имя атрибута, фиксирует любые (представленные точками) символы после него, пока не найдет закрывающую скобку или один пробел.Обратите внимание, что они очень упрощены и должны быть изменены, чтобы компенсировать правовые изменения в формате html .... такие как пробелы по обе стороны от знака равенства.Но это начало.Regexr.com - хороший инструмент для создания и тестирования регулярных выражений.Правая часть дает вам библиотеку компонентов, из которых можно выбирать, с определениями того, что они означают в регулярном выражении.
Как указано Истиной, это не очень гибкий / масштабируемый / правильный способ сделать этот типвещь, но она выполняет свою работу в зависимости от ваших потребностей.
value=(.+)[\s>]
name=(.+)[\s>]
size=(.+)[\s>]
Так что вы можете немного ближе познакомиться с регулярными выражениями, подробное описание каждой части ниже:
attribute = соответствует точному имени атрибута, за которым следует знак равенства
(. +) точка представляет любой символ (следите за переносом строки ...), + говорит ему искать 1 или более из них в последовательности.Круглые скобки используются для захвата группы.
[\ s>] класс символов, содержащий буквальный символ > и пробел, обозначаемый / s