У меня есть телефон Nokia N900, и при отправке SMS виджет отображает количество символов, оставшихся в сообщении (и количество фактических коротких сообщений, необходимых для отправки всего сообщения).
Я живу во Франции, где я заметил следующую странную вещь при написании сообщений с не-ASCII-символами:
- некоторые не-ASCII-символы кодируются одним символом / байтом, например"é", "è", "à", "ù"
- Присутствие некоторых не-ASCII-символов, таких как "ç", "ê", "ô", потребляет фиксированное количество в 90 символов /байт + 1 байт на символ
- наличие секунд "ç", "ê" и т. д. потребляет только 1 дополнительный байт.
Так что мне интересно, как кодируются сообщения, потому что я не вижу вышеупомянутую схему, соответствующую традиционным кодировкам, которые я знаю (iso-8859-1, UTF-8, UTF-16...).