Java lib для сжатия файла HTML? - PullRequest
10 голосов
/ 06 марта 2009

Кто-нибудь знает какую-либо хорошую библиотеку Java (или единственный метод), которая может убрать лишние пробелы (разрывы строк, табуляции и т. Д.) Из HTML-файла? Таким образом, HTML-файл превращается в 1 строку в основном.

Спасибо.

ОБНОВЛЕНИЕ: Похоже, что нет библиотеки, которая делает это, поэтому я создал свой собственный проект с открытым исходным кодом для решения этой задачи: http://code.google.com/p/htmlcompressor/

Ответы [ 5 ]

22 голосов
/ 14 марта 2009

Похоже, что нет библиотеки, которая бы делала это, поэтому я создал свой собственный проект с открытым исходным кодом для решения этой задачи, возможно, кто-то найдет это полезным: http://code.google.com/p/htmlcompressor/

4 голосов
/ 06 марта 2009

Лично я только что включил HTTP-сжатие на сервере и оставляю свой HTML читабельным.

Но для того, что вы хотите, вы можете просто использовать String.replaceAll () с регулярным выражением, которое соответствует указанному вами. С макушки головы, что-то вроде:

small=large.replaceAll("\\s{2,}"," ");
2 голосов
/ 06 марта 2009

Будьте осторожны с этим. Текст внутри элементов pre и textarea будет поврежден. Кроме того, встроенный JavaScript внутри элементов скрипта должен заканчиваться столбцом ;. Наконец, если вы кодируете встроенный javascript с html-комментариями (чтобы избежать некоторых старых ошибок в браузере), это в конечном итоге закомментирует весь встроенный код javascript.

Почему ты хочешь это сделать? Если вы хотите уменьшить размер загружаемого html-файла, все, что вам нужно - это GZIP фильтр .

1 голос
/ 06 марта 2009

Предполагая, что необходимо уменьшить размер HTML, чтобы оптимизировать байты, отправляемые по сети, почему бы не сделать так, чтобы HTTP-сервер работал? Читайте здесь .

Будет ли это работать? К сожалению, не бесплатно.

0 голосов
/ 06 марта 2009
input.replaceAll("\s+", " ");

преобразует любые пробелы в один пробел

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...