Пытаясь понять GSM-7 и GSM-8 - PullRequest
0 голосов
/ 20 марта 2020

Я работаю над текстовыми сообщениями и хочу понять наборы кодировки SMS. Я прочитал https://en.wikipedia.org/wiki/GSM_03.38, но эти наборы кажутся мне безумными:

  1. GSM-7 тратит драгоценное место, включая греческие буквы
  2. GSM-7 включает в себя Ç но не
  3. GSM-8 может определять 128 символов, но вместо этого определяет только 12: это огромная трата пространства!

Они могли бы легко подогнать все полезные символы для всех латинских языков. По крайней мере, в GSM-8, но вместо этого они решили потратить много места, и в результате вам часто приходится использовать UCS-2, что означает, что тексты должны быть разделены для многих людей. Например, если вы используете «ç» на французском языке, вам нужно использовать UCS-2; если вы используете обычное письмо Spani sh в США, вам также понадобится UCS-2.

Может кто-нибудь восстановить мою веру в людей, которые это изобрели, и дать мне вескую причину, почему эти наборы как это?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...