Я хочу написать алгоритм для сжатия вывода HTML для CMS, которую я пишу на PHP, написанную с помощью инфраструктуры CodeIgniter.
Я думал о том, чтобы попытаться удалить пробелы между любыми угловыми скобками, кроме элементов <script>
, <pre>
и <style>
, и просто игнорировать эти элементы для простоты. Я должен уточнить, что это пробел между последовательными тегами, без текста между ними.
Как мне разобрать HTML-код, чтобы найти пробел, который я хочу удалить?
Edit:
Для начала я хочу удалить все символы табуляции, которые не входят в теги <pre>
. Я уверен, что это можно сделать с помощью регулярных выражений, но каковы альтернативы?