Все кодировки сводятся к тому, что если вы используете 8 битов для символа, вы можете обрабатывать только 256 различных символов. С учетом того, что Великобритания и США создали соглашения, 256 стандартных символов ASCII - это, в основном, западные символы без акцента.
Вот где в игру вступают UTF8 и UTF16. UTF8 очень похож на ASCII - он использует один байт для большинства западных символов. Однако есть некоторые специальные байты, которые указывают символ вне нормального диапазона ASCII - два байта, которые следуют непосредственно за специальным байтом, затем указывают на истинный символ.
UTF16 (также известный как Unicode) избавляется от специального байта индикатора и просто использует 16 бит для каждого символа. Как мы все знаем, 16 битов дают вам 65536 различных символов, что недостаточно для охвата всех письменных символов мира, но в основном это работает.
Итак, чтобы ответить на ваш вопрос: если большинство ваших символов - западные символы без акцента, UTF8 будет для вас наиболее компактным представлением (и наиболее читаемым во многих редакторах). Если большинство ваших персонажей не западные (скажем, китайские), вы, вероятно, захотите использовать Unicode (он же UTF16).
Удачи!