Влияет ли сжатый XML-файл на производительность и память?Какие советы по улучшению XML? - PullRequest
0 голосов
/ 22 июля 2011

У меня вопрос, есть ли простой способ сжать файл XML. Я читал про EXI, gzip и тому подобное, но я не понимал, как это сделать, или если мой вопрос возможен.

То, чего я пытаюсь добиться, - это уменьшить размер моего XML-файла, который я использую с SimpleXML. Возможно ли это, и если да, то повлияет ли это на скорость / производительность / память?

Кроме того, большой файл XML считается большим в зависимости от размера или количества элементов?

Есть ли какие-нибудь советы, которым вы должны следовать для "лучшего" XML?

Ответы [ 3 ]

2 голосов
/ 22 июля 2011

Да, это влияет на производительность, потому что прежде чем любой XML-парсер сможет прочитать данные, он должен быть распакован.Сколько памяти он потребляет, зависит от сжатия и XML-парсера, но он не будет использовать меньше памяти (причина та же: в любом случае он должен быть распакован).

«Большой XML» считается большимв соответствии с размером файла и количеством элементов, поскольку размер файла обычно напрямую зависит от содержимого (количества элементов).

0 голосов
/ 22 июля 2011

Были серьезные попытки уменьшить накладные расходы на XML, см. Двоичный XML и в этой статье

Будут ситуации, когда уменьшается объем данных, которые должны быть отправленыпо проводу важно, и стоит заплатить некоторую дополнительную стоимость обработки на каждом конце.

Существует некоторая напряженность между использованием самоописывающего, но многословного формата, такого как XML, и последующей обеспокоенностью по поводу размера получаемой полезной нагрузки.Добавление некоторой формы бинарного сжатия похоже на оплату ракетного ускорителя на очень роскошной, но медленной машине, вы пытаетесь получить лучшее из обоих миров.

0 голосов
/ 22 июля 2011

Лучший способ, который я могу себе представить, это просто удалить как можно больше ненужных данных.т.е. не делайте это отформатированным для удобства чтения человеком.Это будет включать в себя много ненужных пробелов / табуляции / новых строк.По возможности используйте самозакрывающиеся теги и просто уменьшите содержание до минимума, который все еще соответствует спецификациям XML.Я уверен, что есть компрессоры, которые делают это.Этот тип «сжатия» не требует распаковки перед анализом, но, в свою очередь, может не сэкономить много места.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...