Честно говоря, регулярные выражения - не лучшая идея для этого типа анализа.Публикуемое вами регулярное выражение, вероятно, отлично подойдет для простых случаев, но если все усложнится, у вас будут огромные проблемы (по той же причине, по которой вы не можете надежно анализировать HTML с помощью регулярных выражений).Я знаю, что вы, вероятно, не хотите этого слышать, я знаю, что не сделал этого, когда я задал тот же тип вопросов, но разбор строк стал НАМ ПРАВИЛЬНО более надежным после того, как я перестал пытаться использовать регулярные выражения для всего.
jTopas - это токенизатор AWESOME, который позволяет довольно легко писать парсеры вручную (я НАСТОЯТЕЛЬНО рекомендую jtopas по сравнению со стандартными библиотеками java scanner / etc ..).Если вы хотите увидеть jtopas в действии, здесь - это некоторые парсеры, которые я написал, используя jTopas для анализа этого типа файла
Если вы анализируете файлы XML, вы должны использовать библиотеку парсера xml.Не делайте это сами, если только вы не делаете это для развлечения, есть множество проверенных вариантов