Как я могу преобразовать некоторый HTML-фрагмент в XHTML, используя groovy? - PullRequest
1 голос
/ 08 июля 2011

У меня есть входные данные String, содержащие некоторый фрагмент HTML, как в следующем примере

I would have enever thought that <b>those infamous tags</b>, 
born in the <abbr title="Don't like that acronym">SGML</abbr> realm,
would make their way into the web of objects that we now experience.

Очевидно, что настоящий намного сложнее (включая ссылки, iamges, div и т. Д.)Я хотел бы написать метод, имеющий следующий прототип

String toXHTML(String html) {
     // What do I have to write here ?
}

Ответы [ 2 ]

0 голосов
/ 11 июля 2011

Проверьте это: http://blog.foosion.org/2008/06/09/parse-html-the-groovy-way/ Это может быть то, что вы ищете.

0 голосов
/ 08 июля 2011

Без описания формата ввода это, вероятно, будет что-то вроде html. Разбор такого беспорядка быстро становится ужасным. Но похоже, что кто-то уже хорошо поработал:

#!/usr/bin/env groovy
@Grapes(
    @Grab(group='jtidy', module='jtidy', version='4aug2000r7-dev')
)
import org.w3c.tidy.*
def tidy = new Tidy()
tidy.parse(System.in, System.out)

Используйте силу, Ридюйдель.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...