Практическая разница в SVG-файлах с XML-кодировкой ISO-8859-1 и UTF-8 - PullRequest
0 голосов
/ 11 января 2019

Если использовать SVG для графических значков и не отображать какие-либо менее типичные символы (не говоря уже о каких-либо символах вообще), существует ли заметная разница в кодировке UTF-8 XML по сравнению с ISO-8859-1?

Я получаю на несколько байтов меньше, когда я сохраняю UTF-8, но я предполагаю, что это потому, что слово короче, интересно, если из-за большего набора символов для кодирования в UTF-8, есть ли случаи, когда оно может быть наоборот?

Или кодирование вряд ли повлияет на размер файла в этом случае?

Ответы [ 2 ]

0 голосов
/ 11 января 2019

ISO 8859-1 более компактен для символов в диапазоне 128-255, UTF-8 более компактен для символов выше 255, поэтому все зависит от статистического распределения символов в вашем документе. Если вас беспокоит количество байтов, то есть гораздо лучшие способы уменьшить размер, чем беспокоиться о кодировке.

0 голосов
/ 11 января 2019

Вы можете легко измерить это самостоятельно.

  1. Построить пересечение обоих наборов символов.
  2. Все остальные символы имеют значение.
  3. Добавьте потребление байтов первого шага в оба набора по отдельности, чтобы получить мощность двух новых наборов.
  4. Теперь вы получили потребление байтов каждого набора в целочисленных значениях.

Это алгоритм для определения того, какое кодирование символов более эффективно с помощью подсчета байтов.

...