Если вы работаете с большим количеством азиатского текста (больше, чем латинского текста), вы можете рассмотреть UTF-16. UTF-8 может точно представлять весь диапазон символов Unicode, но он оптимизирован для текста, который в основном является ASCII. UTF-16 экономит пространство на всей базовой многоязычной плоскости .
Но UTF-8, безусловно, «достаточно хорош» - коррупция не возникнет просто потому, что вы используете UTF-8, скажем, UTF-16.