ASCII против UTF-8? - PullRequest
       0

ASCII против UTF-8?

0 голосов
/ 09 декабря 2018

Предполагается, что размер хранилища важен: у меня есть длинный список цифр (0-9), которые я хочу записать в файл.С точки зрения хранения, было бы более эффективно использовать ASCII или UTF-8 в качестве кодировки?Можно ли создать файл меньшего размера, используя что-то еще?

Ответы [ 2 ]

0 голосов
/ 09 декабря 2018

Нет разницы между ASCII и UTF-8 при хранении цифр.Более плотная упаковка будет использовать 4 бита на цифру ( BCD ).

Если вы хотите пойти ниже этого, вам нужно воспользоваться тем фактом, что длинные последовательности из 10 базовых значенийможет быть представлен как 2-базовые (двоичные) значения.

0 голосов
/ 09 декабря 2018

В этом случае нет абсолютно никакой разницы;UTF-8 идентичен ASCII в этом диапазоне символов.

Если хранение является важным фактором, возможно, обратите внимание на сжатие.Простое сжатие Хаффмана будет использовать что-то вроде 3 бит на байт для данных такого типа.Если существуют шаблоны периодичности, современный алгоритм сжатия может пойти еще дальше.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...