Альтернативы регулярному выражению для HTML - PullRequest
1 голос
/ 10 марта 2012

Я много раз видел, и снова и снова и снова в переполнении стека, что регулярное выражение НЕ подходит для XHTML.Однако то, что я не видел, является альтернативой.

Большинство текстовых редакторов имеют встроенный поиск и замену RegEx, который просто супер прост в использовании.Ну, за исключением того факта, что он плохо работает с HTML.Есть ли какой-нибудь инструмент или язык, предназначенный для анализа и вместо XHTML?Было бы замечательно, если бы вы могли сказать «найти все теги абзаца, которые имеют класс« цитата », которые находятся в DIV с классом« обезьяна », а затем добавить тег H2 с« цитатой обезьяны »внутри.

Другой пример, с которым я пытаюсь найти решение, - это найти все слова в тегах Paragraph и обернуть вокруг них тег SPAN (для пословного выделения звука). Такие вещи.

Есть ли инструмент или язык, предназначенный для такого рода вещей?

Ответы [ 2 ]

3 голосов
/ 10 марта 2012

Если у вас правильно сформированный документ, XSLT и XPATH могут делать то, что вам нужно.

3 голосов
/ 10 марта 2012

Из вашего последнего комментария я предполагаю, что вам нужно что-то полезное из командной строки.

Если это так, то довольно неплохо ответили здесь:

Эквивалент Grep и Sed для обработки командной строки XML

...