Предыдущие ответы верны, , если вы используете простой ASCII (что означает только базовый английский алфавит нижний + верхний регистр, арабские цифры и базовую английскую пунктуацию) Как только вы используете более этого, в игру вступают кодировки символов.
Прежде всего, вам всегда нужно помнить, какую кодировку вы используете - некоторые символы даже не существуют в некоторых кодировках (обычный ASCII содержит только 127 символов), некоторые существуют в одной кодировке, но не в другой, и т. Д. Поэтому вам нужно знать, какую кодировку вы используете.
Во-вторых, некоторые кодировки используют многобайтовые символы (например, utf-8), то есть один символ сохраняется как один или несколько байтов. У них также нет кода ASCII - см., Например, Статья Джоэла Спольски о Unicode для более подробной информации.