поиск и замена HTML на стороне сервера - PullRequest
1 голос
/ 15 января 2011

Мне нравится искать что-то вроде stack <"sometag"> overflow</"sometag"> и заменить на stack <"sometag">underflow</"sometag">

Это часть большого HTML-текста, и мне нравится делать это на Java (есть некоторые ограничения на технологии на стороне сервера, которые я могу использовать) Я искал и нашел этот пост: Как найти / заменить текст в HTML при сохранении тегов / структуры HTML

В одном из ответов предлагается пометить специальными маркерами, создать простой текст и затем использовать регулярное выражение. Наконец, снятие отметки и возврат строки в html. Но предполагается, что строка находится в заданной позиции в тексте. У меня нет возможности узнать, где будут строки и сколько раз они могут повторяться.

Конечно, прямое использование поиска и замены регулярных выражений здесь не подходит, так как мне нужно сохранить html-теги.

Заранее спасибо!

Ответы [ 2 ]

1 голос
/ 15 января 2011

Взгляните на http://jsoup.org/ Это делает все виды вещей с тегами.

1 голос
/ 15 января 2011

Я бы несколько опасался делать регулярные выражения для изменения HTML-файла. Слишком много вещей пошло бы не так.

Ваши HTML-файлы соответствуют XML? (например, XHTML?). В этом случае вам может быть лучше выполнять преобразования уровня XML с помощью XSL или анализатора на основе запросов.

...