Я бы порекомендовал "utf16", если вы храните много китайских символов.Это будет хранить все символы, с которыми вы, вероятно, столкнетесь, в двух байтах (включая скучные старые символы ASCII!).
Это лучше, чем utf8 для данных этого типа, поскольку обычные идеограммы занимают три или четыре байта памятичасто требуется сложное преобразование в utf16 / 32, прежде чем их можно будет использовать в программе.