Кодирование Хаффмана никак не зависит от размера алфавита.Длина кода Хаффмана для символа логарифмически пропорциональна обратной частоте символа;другими словами, чем реже символ, тем длиннее его код Хаффмана.Если какая-то латинская буква чрезвычайно редко встречается в корпусе, который вы сжимаете, ее длина кода будет такой же, как и длина китайского символа, которая одинаково необычна.
Тот факт, что существует так много китайских символов, означает, что больше из них будет редким, но, безусловно, возможно иметь два корпуса, один на китайском, а другой с использованием латинских символов, в которых самый длинный латинский коддлиннее, чем самый длинный китайский код.